ai-engineer.sh
GitHub

Introduction

Ovaj kurs vas uči kako veliki jezički modeli (LLM-ovi) funkcionišu i kako da sa njima gradite sisteme. Pokriva kompletan stack — od matematike iza transformer-a do inženjeringa produkcijskih sistema koji efikasno koriste LLM-ove.

Who this is for

Materijal je namenjen softverskim inženjerima i tehničkim praktičarima koji žele da odu dalje od običnog poziva API-ja i razumeju šta se dešava pod haubom. Ne treba vam doktorat iz mašinskog učenja, ali bi trebalo da vam ne smeta:

  • Python — primarni jezik korišćen u primerima
  • Basic linear algebra — vektori, matrice, skalarni proizvodi
  • General programming concepts — API-ji, strukture podataka, kontrola verzija

Ako ste koristili ChatGPT ili Claude i želite da razumete kako rade — ili da nadgradite sopstvene alate povrh njih — došli ste na pravo mesto.

What you'll learn

Kurs je organizovan u četiri sekcije koje se nadovezuju jedna na drugu:

SekcijaFokus
Getting StartedPostavka, preduslovi i orijentacija
FundamentalsKako se LLM-ovi grade — podaci, tokenizacija, treniranje
TransformersArhitektura koja pokreće moderne LLM-ove — attention, embedding-zi, inferencija
LLM EngineeringPrompting, RAG, fine-tuning, agenti i produkcijski obrasci

Svaki članak je samostalan, ali pretpostavlja da ste pročitali one koji mu prethode. Krenite od početka ako ste novi, ili preskočite na konkretnu temu ako već imate osnovu.

How to use this site

  • Čitajte redom — sidebar navigacija prati preporučeni redosled
  • Pokrenite kod — primeri su tu da se izvršavaju, ne samo da se čitaju
  • Proverite preduslove — neki članci zahtevaju specifične biblioteke ili hardver

Svi primeri koda koriste Python i PyTorch osim ako nije drugačije naznačeno. Pogledajte stranicu sa preduslovima za podešavanje okruženja.

Why understand the internals

LLM-ove možete efikasno koristiti i bez razumevanja kako rade. Ali poznavanje unutrašnjosti vam pomaže da:

  • Debug-ujete neočekivano ponašanje — tokenizacijski artefakti, granice context window-a i halucinacije imaju tehnička objašnjenja
  • Izaberete pravi model — broj parametara, dužina konteksta i trening podaci su važni za različite slučajeve upotrebe
  • Gradite bolje sisteme — prompt engineering, RAG i fine-tuning su efikasniji kada razumete šta model zaista radi
  • Procenjujete nova kretanja — oblast se brzo razvija, a čvrsta osnova vam omogućava da razdvojite signal od šuma

Further reading

Resursi koje vredi sačuvati pre nego što zaronite:

Izmeni stranicu na GitHub-u