Svět AI je plný zkratek a odborných pojmů, které se tváří složitě, ale za každým z nich stojí jednoduchá myšlenka. Tady je základní slovník, na který se můžete kdykoli vrátit.
Pojem nenalezen. Napište mi na pavel@filip.consulting a doplním ho.
Modely a architektury
- LLM - Large Language Model
- Velký jazykový model. Základ pro ChatGPT, Claude, Gemini. Model trénovaný na obrovském množství textu.
- SLM - Small Language Model
- Menší jazykový model navržený pro efektivní provoz na slabším hardwaru nebo lokálně. Příklady: Phi od Microsoftu, Mistral. Rychlejší a levnější, ale méně schopný než velké LLM.
- Transformer
- Architektura neuronové sítě, na které je postavena většina moderních LLM. Klíčová inovace: mechanismus "attention" umožňující AI sledovat kontext celé věty.
- GPT - Generative Pre-trained Transformer
- Typ modelu od OpenAI (ChatGPT). Předtrénovaný na textu z internetu, schopný generovat lidsky znějící text.
- Multimodální AI
- Model, který umí pracovat s více typy vstupů najednou - textem, obrázky, zvukem, videem. GPT-4o nebo Claude 3 jsou multimodální modely.
- Open source AI
- Model, jehož váhy (nebo celý kód) jsou veřejně dostupné. Příklady: Llama od Meta, Mistral. Lze provozovat lokálně bez závislosti na externím poskytovateli.
- AGI - Artificial General Intelligence
- Obecná umělá inteligence - hypotetický systém schopný vykonávat jakýkoli intelektuální úkol, který zvládne člověk. Zatím neexistuje.
Trénování a data
- Training data / Trénovací data
- Data, na kterých se model učí. Pro LLM typicky miliardy webových stránek, knih a článků.
- Token
- Základní jednotka textu, se kterou AI pracuje. Přibližně odpovídá slabice nebo krátké slabice (v angličtině zhruba 3/4 slova). Cena volání API a délka kontextového okna se měří v tokenech.
- Fine-tuning / Doladění
- Dotrénování obecného modelu na specializovaných datech. Takto vznikají modely pro medicínu, právo, zákaznickou péči atd.
- RLHF - Reinforcement Learning from Human Feedback
- Lidé hodnotí výstupy modelu a toto hodnocení se používá jako zpětná vazba pro trénování. Díky RLHF jsou modely zdvořilejší a bezpečnější.
- Benchmark
- Standardizovaný test pro porovnání schopností AI modelů. Příklady: MMLU (znalosti), HumanEval (kódování), HellaSwag (zdravý rozum). Čím vyšší skóre, tím lépe - ale benchmarky neříkají vše o praktické použitelnosti.
- Embedding / Vektorové reprezentace
- Způsob, jak AI "zakóduje" text nebo obrázek do čísel (vektoru). Podobné věci mají podobné vektory. Základ pro sémantické vyhledávání a RAG systémy.
Práce s modelem
- Prompt
- Vstupní text, který dáváme AI. Kvalita promptu přímo určuje kvalitu odpovědi. Celá disciplína "prompt engineering" se zabývá tím, jak promptovat efektivně.
- System prompt
- Skrytá instrukce, která definuje chování AI ještě před tím, než uživatel napíše první zprávu. Určuje roli, tón, omezení. Vývojáři ho používají k přizpůsobení modelu konkrétní aplikaci.
- Zero-shot / Few-shot
- Zero-shot: model dostane úkol bez příkladu a musí si poradit sám. Few-shot: model dostane 1-3 příklady, jak má odpovídat. Few-shot promptování výrazně zlepší kvalitu výstupu u složitých úkolů.
- Chain-of-thought / Řetězec myšlenek
- Technika, kdy AI přemýšlí nahlas - krok za krokem - než dá finální odpověď. Výrazně zlepšuje výsledky u matematiky, logiky a složitých rozhodnutí. Stačí do promptu přidat "Přemýšlej krok za krokem."
- Halucinace
- AI tváří odpovídá sebejistě, ale obsah je nepravdivý nebo vymyšlený. Typicky: citace knih které neexistují, špatná data, smyšlené osoby.
- Context window / Kontextové okno
- Maximální množství textu, které model "vidí" najednou. Vše mimo toto okno model "zapomene".
- RAG - Retrieval-Augmented Generation
- Technika, kdy AI při generování odpovědi nejprve vyhledá relevantní dokumenty a pak na jejich základě odpovídá. Snižuje halucinace a umožňuje pracovat s aktuálními daty.
- Temperature / Teplota
- Parametr určující míru náhodnosti odpovědi. Nízká = konzistentní a předvídatelná. Vysoká = kreativní a variabilní.
- NLP - Natural Language Processing
- Zpracování přirozeného jazyka. Obor AI zaměřený na porozumění a generování lidského jazyka.
AI agenti a aplikace
- AI agent
- AI, která nejen odpovídá, ale aktivně vykonává úkoly - prohledává web, píše kód, spouští příkazy, komunikuje s API. Claude Code je příklad AI agenta. Agenti mohou pracovat autonomně a plnit vícekrokové úkoly.
- Vektorová databáze
- Databáze optimalizovaná pro ukládání a vyhledávání embeddingů (vektorů). Klíčová součást RAG systémů. Příklady: Pinecone, Weaviate, pgvector. Umí najít "podobné" dokumenty, ne jen přesnou shodu.
- API - Application Programming Interface
- Rozhraní, přes které aplikace komunikují s AI modelem. Místo chatovacího okna posíláte požadavky programově a dostáváte odpovědi zpět do svého systému. OpenAI API, Anthropic API.
- MCP - Model Context Protocol
- Otevřený standard od Anthropic pro propojení AI modelů s externími nástroji a daty (databáze, soubory, webové služby). Umožňuje AI agentům bezpečně a standardizovaně přistupovat k informacím mimo jejich trénovaná data.