Introduction

Ovaj kurs vas uči kako veliki jezički modeli (LLM-ovi) funkcionišu i kako da sa njima gradite sisteme. Pokriva kompletan stack — od matematike iza transformer-a do inženjeringa produkcijskih sistema koji efikasno koriste LLM-ove.

Who this is for

Materijal je namenjen softverskim inženjerima i tehničkim praktičarima koji žele da odu dalje od običnog poziva API-ja i razumeju šta se dešava pod haubom. Ne treba vam doktorat iz mašinskog učenja, ali bi trebalo da vam ne smeta:

Python — primarni jezik korišćen u primerima
Basic linear algebra — vektori, matrice, skalarni proizvodi
General programming concepts — API-ji, strukture podataka, kontrola verzija

Ako ste koristili ChatGPT ili Claude i želite da razumete kako rade — ili da nadgradite sopstvene alate povrh njih — došli ste na pravo mesto.

What you'll learn

Kurs je organizovan u četiri sekcije koje se nadovezuju jedna na drugu:

Sekcija	Fokus
Getting Started	Postavka, preduslovi i orijentacija
Fundamentals	Kako se LLM-ovi grade — podaci, tokenizacija, treniranje
Transformers	Arhitektura koja pokreće moderne LLM-ove — attention, embedding-zi, inferencija
LLM Engineering	Prompting, RAG, fine-tuning, agenti i produkcijski obrasci

Svaki članak je samostalan, ali pretpostavlja da ste pročitali one koji mu prethode. Krenite od početka ako ste novi, ili preskočite na konkretnu temu ako već imate osnovu.

How to use this site

Čitajte redom — sidebar navigacija prati preporučeni redosled
Pokrenite kod — primeri su tu da se izvršavaju, ne samo da se čitaju
Proverite preduslove — neki članci zahtevaju specifične biblioteke ili hardver

Svi primeri koda koriste Python i PyTorch osim ako nije drugačije naznačeno. Pogledajte stranicu sa preduslovima za podešavanje okruženja.

Why understand the internals

LLM-ove možete efikasno koristiti i bez razumevanja kako rade. Ali poznavanje unutrašnjosti vam pomaže da:

Debug-ujete neočekivano ponašanje — tokenizacijski artefakti, granice context window-a i halucinacije imaju tehnička objašnjenja
Izaberete pravi model — broj parametara, dužina konteksta i trening podaci su važni za različite slučajeve upotrebe
Gradite bolje sisteme — prompt engineering, RAG i fine-tuning su efikasniji kada razumete šta model zaista radi
Procenjujete nova kretanja — oblast se brzo razvija, a čvrsta osnova vam omogućava da razdvojite signal od šuma

Introduction

Who this is for

What you'll learn

How to use this site

Why understand the internals

Further reading