Svět AI je plný zkratek a odborných pojmů, které se tváří složitě, ale za každým z nich stojí jednoduchá myšlenka. Tady je základní slovník, na který se můžete kdykoli vrátit.

Pojem nenalezen. Napište mi na pavel@filip.consulting a doplním ho.

Modely a architektury

LLM - Large Language Model
Velký jazykový model. Základ pro ChatGPT, Claude, Gemini. Model trénovaný na obrovském množství textu.
SLM - Small Language Model
Menší jazykový model navržený pro efektivní provoz na slabším hardwaru nebo lokálně. Příklady: Phi od Microsoftu, Mistral. Rychlejší a levnější, ale méně schopný než velké LLM.
Transformer
Architektura neuronové sítě, na které je postavena většina moderních LLM. Klíčová inovace: mechanismus "attention" umožňující AI sledovat kontext celé věty.
GPT - Generative Pre-trained Transformer
Typ modelu od OpenAI (ChatGPT). Předtrénovaný na textu z internetu, schopný generovat lidsky znějící text.
Multimodální AI
Model, který umí pracovat s více typy vstupů najednou - textem, obrázky, zvukem, videem. GPT-4o nebo Claude 3 jsou multimodální modely.
Open source AI
Model, jehož váhy (nebo celý kód) jsou veřejně dostupné. Příklady: Llama od Meta, Mistral. Lze provozovat lokálně bez závislosti na externím poskytovateli.
AGI - Artificial General Intelligence
Obecná umělá inteligence - hypotetický systém schopný vykonávat jakýkoli intelektuální úkol, který zvládne člověk. Zatím neexistuje.

Trénování a data

Training data / Trénovací data
Data, na kterých se model učí. Pro LLM typicky miliardy webových stránek, knih a článků.
Token
Základní jednotka textu, se kterou AI pracuje. Přibližně odpovídá slabice nebo krátké slabice (v angličtině zhruba 3/4 slova). Cena volání API a délka kontextového okna se měří v tokenech.
Fine-tuning / Doladění
Dotrénování obecného modelu na specializovaných datech. Takto vznikají modely pro medicínu, právo, zákaznickou péči atd.
RLHF - Reinforcement Learning from Human Feedback
Lidé hodnotí výstupy modelu a toto hodnocení se používá jako zpětná vazba pro trénování. Díky RLHF jsou modely zdvořilejší a bezpečnější.
Benchmark
Standardizovaný test pro porovnání schopností AI modelů. Příklady: MMLU (znalosti), HumanEval (kódování), HellaSwag (zdravý rozum). Čím vyšší skóre, tím lépe - ale benchmarky neříkají vše o praktické použitelnosti.
Embedding / Vektorové reprezentace
Způsob, jak AI "zakóduje" text nebo obrázek do čísel (vektoru). Podobné věci mají podobné vektory. Základ pro sémantické vyhledávání a RAG systémy.

Práce s modelem

Prompt
Vstupní text, který dáváme AI. Kvalita promptu přímo určuje kvalitu odpovědi. Celá disciplína "prompt engineering" se zabývá tím, jak promptovat efektivně.
System prompt
Skrytá instrukce, která definuje chování AI ještě před tím, než uživatel napíše první zprávu. Určuje roli, tón, omezení. Vývojáři ho používají k přizpůsobení modelu konkrétní aplikaci.
Zero-shot / Few-shot
Zero-shot: model dostane úkol bez příkladu a musí si poradit sám. Few-shot: model dostane 1-3 příklady, jak má odpovídat. Few-shot promptování výrazně zlepší kvalitu výstupu u složitých úkolů.
Chain-of-thought / Řetězec myšlenek
Technika, kdy AI přemýšlí nahlas - krok za krokem - než dá finální odpověď. Výrazně zlepšuje výsledky u matematiky, logiky a složitých rozhodnutí. Stačí do promptu přidat "Přemýšlej krok za krokem."
Halucinace
AI tváří odpovídá sebejistě, ale obsah je nepravdivý nebo vymyšlený. Typicky: citace knih které neexistují, špatná data, smyšlené osoby.
Context window / Kontextové okno
Maximální množství textu, které model "vidí" najednou. Vše mimo toto okno model "zapomene".
RAG - Retrieval-Augmented Generation
Technika, kdy AI při generování odpovědi nejprve vyhledá relevantní dokumenty a pak na jejich základě odpovídá. Snižuje halucinace a umožňuje pracovat s aktuálními daty.
Temperature / Teplota
Parametr určující míru náhodnosti odpovědi. Nízká = konzistentní a předvídatelná. Vysoká = kreativní a variabilní.
NLP - Natural Language Processing
Zpracování přirozeného jazyka. Obor AI zaměřený na porozumění a generování lidského jazyka.

AI agenti a aplikace

AI agent
AI, která nejen odpovídá, ale aktivně vykonává úkoly - prohledává web, píše kód, spouští příkazy, komunikuje s API. Claude Code je příklad AI agenta. Agenti mohou pracovat autonomně a plnit vícekrokové úkoly.
Vektorová databáze
Databáze optimalizovaná pro ukládání a vyhledávání embeddingů (vektorů). Klíčová součást RAG systémů. Příklady: Pinecone, Weaviate, pgvector. Umí najít "podobné" dokumenty, ne jen přesnou shodu.
API - Application Programming Interface
Rozhraní, přes které aplikace komunikují s AI modelem. Místo chatovacího okna posíláte požadavky programově a dostáváte odpovědi zpět do svého systému. OpenAI API, Anthropic API.
MCP - Model Context Protocol
Otevřený standard od Anthropic pro propojení AI modelů s externími nástroji a daty (databáze, soubory, webové služby). Umožňuje AI agentům bezpečně a standardizovaně přistupovat k informacím mimo jejich trénovaná data.