Seznam pojmů a zkratek

Svět AI je plný zkratek a odborných pojmů, které se tváří složitě, ale za každým z nich stojí jednoduchá myšlenka. Tady je základní slovník, na který se můžete kdykoli vrátit.

Pojem nenalezen. Napište mi na pavel@filip.consulting a doplním ho.

Modely a architektury

LLM - Large Language Model: Velký jazykový model. Základ pro ChatGPT, Claude, Gemini. Model trénovaný na obrovském množství textu.
SLM - Small Language Model: Menší jazykový model navržený pro efektivní provoz na slabším hardwaru nebo lokálně. Příklady: Phi od Microsoftu, Mistral. Rychlejší a levnější, ale méně schopný než velké LLM.
Transformer: Architektura neuronové sítě, na které je postavena většina moderních LLM. Klíčová inovace: mechanismus "attention" umožňující AI sledovat kontext celé věty.
GPT - Generative Pre-trained Transformer: Typ modelu od OpenAI (ChatGPT). Předtrénovaný na textu z internetu, schopný generovat lidsky znějící text.
Multimodální AI: Model, který umí pracovat s více typy vstupů najednou - textem, obrázky, zvukem, videem. GPT-4o nebo Claude 3 jsou multimodální modely.
Open source AI: Model, jehož váhy (nebo celý kód) jsou veřejně dostupné. Příklady: Llama od Meta, Mistral. Lze provozovat lokálně bez závislosti na externím poskytovateli.
AGI - Artificial General Intelligence: Obecná umělá inteligence - hypotetický systém schopný vykonávat jakýkoli intelektuální úkol, který zvládne člověk. Zatím neexistuje.

Trénování a data

Training data / Trénovací data: Data, na kterých se model učí. Pro LLM typicky miliardy webových stránek, knih a článků.
Token: Základní jednotka textu, se kterou AI pracuje. Přibližně odpovídá slabice nebo krátké slabice (v angličtině zhruba 3/4 slova). Cena volání API a délka kontextového okna se měří v tokenech.
Fine-tuning / Doladění: Dotrénování obecného modelu na specializovaných datech. Takto vznikají modely pro medicínu, právo, zákaznickou péči atd.
RLHF - Reinforcement Learning from Human Feedback: Lidé hodnotí výstupy modelu a toto hodnocení se používá jako zpětná vazba pro trénování. Díky RLHF jsou modely zdvořilejší a bezpečnější.
Benchmark: Standardizovaný test pro porovnání schopností AI modelů. Příklady: MMLU (znalosti), HumanEval (kódování), HellaSwag (zdravý rozum). Čím vyšší skóre, tím lépe - ale benchmarky neříkají vše o praktické použitelnosti.
Embedding / Vektorové reprezentace: Způsob, jak AI "zakóduje" text nebo obrázek do čísel (vektoru). Podobné věci mají podobné vektory. Základ pro sémantické vyhledávání a RAG systémy.

Práce s modelem

Prompt: Vstupní text, který dáváme AI. Kvalita promptu přímo určuje kvalitu odpovědi. Celá disciplína "prompt engineering" se zabývá tím, jak promptovat efektivně.
System prompt: Skrytá instrukce, která definuje chování AI ještě před tím, než uživatel napíše první zprávu. Určuje roli, tón, omezení. Vývojáři ho používají k přizpůsobení modelu konkrétní aplikaci.
Zero-shot / Few-shot: Zero-shot: model dostane úkol bez příkladu a musí si poradit sám. Few-shot: model dostane 1-3 příklady, jak má odpovídat. Few-shot promptování výrazně zlepší kvalitu výstupu u složitých úkolů.
Chain-of-thought / Řetězec myšlenek: Technika, kdy AI přemýšlí nahlas - krok za krokem - než dá finální odpověď. Výrazně zlepšuje výsledky u matematiky, logiky a složitých rozhodnutí. Stačí do promptu přidat "Přemýšlej krok za krokem."
Halucinace: AI tváří odpovídá sebejistě, ale obsah je nepravdivý nebo vymyšlený. Typicky: citace knih které neexistují, špatná data, smyšlené osoby.
Context window / Kontextové okno: Maximální množství textu, které model "vidí" najednou. Vše mimo toto okno model "zapomene".
RAG - Retrieval-Augmented Generation: Technika, kdy AI při generování odpovědi nejprve vyhledá relevantní dokumenty a pak na jejich základě odpovídá. Snižuje halucinace a umožňuje pracovat s aktuálními daty.
Temperature / Teplota: Parametr určující míru náhodnosti odpovědi. Nízká = konzistentní a předvídatelná. Vysoká = kreativní a variabilní.
NLP - Natural Language Processing: Zpracování přirozeného jazyka. Obor AI zaměřený na porozumění a generování lidského jazyka.

AI agenti a aplikace

AI agent: AI, která nejen odpovídá, ale aktivně vykonává úkoly - prohledává web, píše kód, spouští příkazy, komunikuje s API. Claude Code je příklad AI agenta. Agenti mohou pracovat autonomně a plnit vícekrokové úkoly.
Vektorová databáze: Databáze optimalizovaná pro ukládání a vyhledávání embeddingů (vektorů). Klíčová součást RAG systémů. Příklady: Pinecone, Weaviate, pgvector. Umí najít "podobné" dokumenty, ne jen přesnou shodu.
API - Application Programming Interface: Rozhraní, přes které aplikace komunikují s AI modelem. Místo chatovacího okna posíláte požadavky programově a dostáváte odpovědi zpět do svého systému. OpenAI API, Anthropic API.
MCP - Model Context Protocol: Otevřený standard od Anthropic pro propojení AI modelů s externími nástroji a daty (databáze, soubory, webové služby). Umožňuje AI agentům bezpečně a standardizovaně přistupovat k informacím mimo jejich trénovaná data.