Introduction
Ovaj kurs vas uči kako veliki jezički modeli (LLM-ovi) funkcionišu i kako da sa njima gradite sisteme. Pokriva kompletan stack — od matematike iza transformer-a do inženjeringa produkcijskih sistema koji efikasno koriste LLM-ove.
Who this is for
Materijal je namenjen softverskim inženjerima i tehničkim praktičarima koji žele da odu dalje od običnog poziva API-ja i razumeju šta se dešava pod haubom. Ne treba vam doktorat iz mašinskog učenja, ali bi trebalo da vam ne smeta:
- Python — primarni jezik korišćen u primerima
- Basic linear algebra — vektori, matrice, skalarni proizvodi
- General programming concepts — API-ji, strukture podataka, kontrola verzija
Ako ste koristili ChatGPT ili Claude i želite da razumete kako rade — ili da nadgradite sopstvene alate povrh njih — došli ste na pravo mesto.
What you'll learn
Kurs je organizovan u četiri sekcije koje se nadovezuju jedna na drugu:
| Sekcija | Fokus |
|---|---|
| Getting Started | Postavka, preduslovi i orijentacija |
| Fundamentals | Kako se LLM-ovi grade — podaci, tokenizacija, treniranje |
| Transformers | Arhitektura koja pokreće moderne LLM-ove — attention, embedding-zi, inferencija |
| LLM Engineering | Prompting, RAG, fine-tuning, agenti i produkcijski obrasci |
Svaki članak je samostalan, ali pretpostavlja da ste pročitali one koji mu prethode. Krenite od početka ako ste novi, ili preskočite na konkretnu temu ako već imate osnovu.
How to use this site
- Čitajte redom — sidebar navigacija prati preporučeni redosled
- Pokrenite kod — primeri su tu da se izvršavaju, ne samo da se čitaju
- Proverite preduslove — neki članci zahtevaju specifične biblioteke ili hardver
Svi primeri koda koriste Python i PyTorch osim ako nije drugačije naznačeno. Pogledajte stranicu sa preduslovima za podešavanje okruženja.
Why understand the internals
LLM-ove možete efikasno koristiti i bez razumevanja kako rade. Ali poznavanje unutrašnjosti vam pomaže da:
- Debug-ujete neočekivano ponašanje — tokenizacijski artefakti, granice context window-a i halucinacije imaju tehnička objašnjenja
- Izaberete pravi model — broj parametara, dužina konteksta i trening podaci su važni za različite slučajeve upotrebe
- Gradite bolje sisteme — prompt engineering, RAG i fine-tuning su efikasniji kada razumete šta model zaista radi
- Procenjujete nova kretanja — oblast se brzo razvija, a čvrsta osnova vam omogućava da razdvojite signal od šuma
Further reading
Resursi koje vredi sačuvati pre nego što zaronite:
- Large Language Models explained briefly — kratak animirani uvod od 3Blue1Brown; najblaži mogući početak pre bilo kakve matematike.
- Deep Dive into LLMs like ChatGPT — Andrej Karpathy prolazi kroz ceo trening stack u 3,5 sata; najbolji pojedinačni orijentacioni talk za obim ovog kursa.
- Hugging Face LLM Course — besplatan i praktičan, prati isti tok fundamentals → transformers → engineering.
- Neural Networks: Zero to Hero — Karpathy-jeva serija "izgradi od nule" (micrograd → GPT → tokenizer) za inženjere koji žele da kodiraju uz video.