Jay Peters, theverge.com
Umělá inteligence je žhavou novinkou v oblasti technologií – zdá se, že každá společnost mluví o tom, jak se jí daří dosahovat pokroků pomocí umělé inteligence nebo jejím vývojem. Oblast umělé inteligence je však také tak plná žargonu, že může být pozoruhodně obtížné pochopit, co se vlastně děje s každým novým vývojem.
Abychom vám pomohli lépe porozumět tomu, co se děje, sestavili jsme seznam některých nejčastějších pojmů z oblasti AI. Pokusíme se vysvětlit, co znamenají a proč jsou důležité.
Umělá inteligence: Pojem „umělá inteligence“, často zkracovaný na AI, je technicky vzato obor informatiky, který se zabývá vytvářením počítačových systémů, které dokáží myslet jako člověk.
V současné době však většinou slýcháme o umělé inteligenci jako o technologii_ nebo dokonce jako o entitě_ a je těžší určit, co přesně to znamená. Často se také používá jako marketingový buzzword, což činí její definici proměnlivější, než by měla být.
Například společnost Google hodně mluví o tom, že do umělé inteligence investuje už léta. To se týká toho, jak je mnoho jeho produktů vylepšeno umělou inteligencí a jak společnost nabízí nástroje, jako je například Gemini, které se tváří jako inteligentní. Existují základní modely umělé inteligence, které pohánějí mnoho nástrojů umělé inteligence, jako je například GPT společnosti OpenAI. Pak je tu generální ředitel společnosti Meta Mark Zuckerberg, který použil AI jako podstatné jméno pro označení jednotlivých chatbotů.
Jak se stále více společností snaží prodat AI jako další velkou věc, způsoby, jakými tento termín a další související názvosloví používají, mohou být ještě matoucí.
Jak se stále více společností snaží prodat umělou inteligenci jako další velkou věc, způsoby, jakými tento termín a další související názvosloví používají, mohou být ještě matoucí. Existuje řada výrazů, na které pravděpodobně narazíte v článcích nebo v marketingu o umělé inteligenci, takže abych vám pomohl se v nich lépe orientovat, sestavil jsem přehled mnoha klíčových termínů z oblasti umělé inteligence, které se v současné době používají. V konečném důsledku se však vše točí kolem snahy udělat počítače chytřejšími.
(Upozorňuji, že uvádím pouze základní přehled mnoha těchto pojmů. Mnohé z nich mohou být často velmi vědecké, ale tento článek by vám snad měl poskytnout základní představu).
Strojové učení: Systémy strojového učení jsou trénovány (o tom, co je to trénování, si povíme později) na datech, aby mohly předpovídat nové informace. Tímto způsobem se mohou „učit“. Strojové učení je obor v rámci umělé inteligence a má zásadní význam pro mnoho technologií umělé inteligence.
Umělá obecná inteligence (AGI): Umělá inteligence, která je stejně chytrá nebo chytřejší než člověk. (Zejména společnost OpenAI investuje do AGI velké prostředky). Mohla by to být neuvěřitelně výkonná technologie, ale pro mnoho lidí je to také potenciálně nejděsivější vyhlídka ohledně možností AI – vzpomeňte si na všechny filmy, které jsme viděli o superinteligentních strojích, které ovládnou svět! Pokud vám to nestačí, pracuje se také na „superinteligenci“, tedy na umělé inteligenci, která je _mnohem_ inteligentnější než člověk.
Generativní umělá inteligence: Technologie umělé inteligence schopná generovat nový text, obrázky, kód a další. Vzpomeňte si na všechny ty zajímavé (i když občas problematické) odpovědi a obrázky, které jste viděli vytvářet v ChatGPT nebo Gemini společnosti Google Nástroje generativní AI jsou poháněny modely AI, které jsou obvykle trénovány na obrovském množství dat.
Halucinace: Ne, nemluvíme o podivných vizích. Jde o toto: Protože generativní nástroje AI jsou tak dobré, jak dobrá jsou data, na kterých jsou vyškoleny, mohou „halucinovat“ nebo si s jistotou vymýšlet, co si myslí, že jsou nejlepší odpovědi na otázky. Tyto halucinace (nebo, chcete-li být zcela upřímní, nesmysly) znamenají, že se systémy mohou dopouštět faktických chyb. Dokonce se vedou spory o tom, zda lze halucinace umělé inteligence někdy „opravit“.
Předpojatost: Halucinace nejsou jediným problémem, který se při práci s UI objevil – a tento se dal předvídat, protože UI jsou koneckonců programovány lidmi. V důsledku toho mohou nástroje umělé inteligence v závislosti na svých tréninkových datech vykazovat zkreslení. Například výzkum z roku 2018 Joy Buolamwini, počítačové vědkyně z MIT Media Lab, a Timnit Gebru, zakladatel a výkonný ředitel Distributed Artificial Intelligence Research Institute (DAIR), jsou spoluautory článku, který ilustruje, že software pro rozpoznávání obličejů má vyšší chybovost, když se snaží identifikovat pohlaví žen tmavší pleti.
Model umělé inteligence: Modely umělé inteligence jsou trénovány na datech, aby mohly samy provádět úkoly nebo činit rozhodnutí.
Velké jazykové modely neboli LLM: Typ modelu umělé inteligence, který dokáže zpracovávat a generovat text v přirozeném jazyce. Příkladem LLM je Claude společnosti Anthropic, který je podle společnosti „užitečný, upřímný a neškodný asistent s konverzačním tónem“.
Difuzní modely: Modely umělé inteligence, které lze použít například pro generování obrázků z textových podnětů. Trénují se tak, že se do obrázku nejprve přidá šum – například statický – a poté se proces obrátí, aby se umělá inteligence naučila vytvářet jasný obrázek. Existují také difuzní modely, které pracují se zvukem a videem.
Základní modely: Tyto generativní modely umělé inteligence jsou vyškoleny na obrovském množství dat, a proto mohou být základem pro širokou škálu aplikací, aniž by pro tyto úlohy musely být speciálně vyškoleny. (Tento termín zavedli výzkumníci ze Stanfordu v roce 2021.) GPT společnosti OpenAI, Gemini společnosti Google, Llama společnosti Meta a Claude společnosti Anthropic jsou příklady základních modelů. Mnoho společností také uvádí své modely AI na trh jako multimodální, což znamená, že dokáží zpracovávat více typů dat, například text, obrázky a video.
Hraniční modely: Kromě základních modelů pracují společnosti zabývající se umělou inteligencí na tzv. hraničních modelech, což je v podstatě jen marketingový termín pro jejich dosud nezveřejněné modely budoucnosti. Teoreticky by tyto modely mohly být mnohem výkonnější než modely umělé inteligence, které jsou k dispozici dnes, i když existují také obavy, že by mohly představovat značná rizika.
Nu, jsou vycvičené. Trénink je proces, při kterém se modely AI učí chápat data určitým způsobem, a to tak, že analyzují soubory dat, aby mohly provádět předpovědi a rozpoznávat vzory. Například velké jazykové modely byly vycvičeny „čtením“ obrovského množství textu. To znamená, že když nástroje umělé inteligence, jako je ChatGPT, odpovídají na vaše dotazy, mohou „rozumět“ tomu, co říkáte, a generovat odpovědi, které znějí jako lidský jazyk a týkají se toho, čeho se váš dotaz týká.
Trénink často vyžaduje značné množství zdrojů a výpočetního výkonu a mnoho společností se spoléhá na výkonné grafické procesory, které jim s tímto tréninkem pomáhají. Modelům umělé inteligence lze dodávat různé typy dat, obvykle v obrovském množství, například text, obrázky, hudbu a video. Tato data se logicky nazývají tréninková data.
Parametry jsou zkrátka proměnné, které se model umělé inteligence učí v rámci svého tréninku. Nejlepší popis toho, co to vlastně znamená, jsem našel od Helen Tonerové, ředitelky pro strategii a granty základního výzkumu v Georgetownském centru pro bezpečnost a nové technologie a bývalé členky správní rady OpenAI:
Parametry jsou čísla uvnitř modelu umělé inteligence, která určují, jak se vstup (např. část textu s výzvou) převede na výstup (např. další slovo po výzvě). Proces „trénování“ modelu umělé inteligence spočívá v tom, že se pomocí matematických optimalizačních technik znovu a znovu upravují hodnoty parametrů modelu, dokud není model velmi dobrý v převodu vstupů na výstupy.
Jinými slovy, parametry modelu AI pomáhají určit odpovědi, které vám pak vyplivne. Společnosti se někdy chlubí tím, kolik má model parametrů, jako způsobem, jak demonstrovat složitost daného modelu.
Zpracování přirozeného jazyka (NLP): To je schopnost strojů porozumět lidskému jazyku díky strojovému učení. Základním příkladem je ChatGPT společnosti OpenAI: dokáže porozumět vašim textovým dotazům a vygenerovat text jako odpověď. Dalším výkonným nástrojem, který umí NLP, je technologie rozpoznávání řeči Whisper společnosti OpenAI, kterou společnost údajně použila k přepisu zvuku z více než 1 milionu hodin videí na YouTube, aby pomohla trénovat GPT-4.
Závěr: Když aplikace generativní umělé inteligence skutečně něco vygeneruje, například když ChatGPT reaguje na dotaz, jak připravit čokoládové sušenky, sdílením receptu. Jedná se o úlohu, kterou váš počítač provádí, když spouštíte místní příkazy AI.
Žetony: Tokeny označují části textu, jako jsou slova, části slov nebo dokonce jednotlivé znaky. LLM například rozdělí text na tokeny, aby je mohl analyzovat, určit, jak spolu tokeny souvisejí, a vygenerovat odpovědi. Čím více tokenů dokáže model zpracovat najednou (veličina známá jako jeho „kontextové okno“), tím sofistikovanější mohou být výsledky.
Neuronová síť: Neuronová síť je počítačová architektura, která pomáhá počítačům zpracovávat data pomocí uzlů, které lze tak trochu přirovnat k neuronům lidského mozku. Neuronové sítě mají zásadní význam pro populární generativní systémy umělé inteligence, protože se mohou naučit chápat složité vzorce bez explicitního programování – například při tréninku na lékařských datech, aby byly schopny stanovit diagnózu.
Transformátor: Transformátor je typ architektury neuronové sítě, která používá mechanismus „pozornosti“ ke zpracování toho, jak spolu části sekvence souvisejí. Společnost Amazon uvádí dobrý příklad toho, co to znamená v praxi:
Uvažujme tuto vstupní sekvenci: „Jakou barvu má obloha?“. Model transformátoru používá vnitřní matematickou reprezentaci, která identifikuje relevanci a vztah mezi slovy barva, obloha a modrá. Tuto znalost použije k vygenerování výstupu: „Obloha je modrá.“
Transformátory jsou nejen velmi výkonné, ale lze je také trénovat rychleji než jiné typy neuronových sítí. Od roku 2017, kdy bývalí zaměstnanci společnosti Google publikovali první článek o transformátorech, se staly velkým důvodem, proč se nyní tolik mluví o generativních technologiích umělé inteligence. (T ve slově ChatGPT znamená transformátor.)
RAG: Tato zkratka znamená „retrieval-augmented generation“, tedy generování rozšířené o vyhledávání. Když model umělé inteligence něco generuje, RAG mu umožňuje najít a přidat kontext z jiných oblastí, než na kterých byl vycvičen, což může zvýšit přesnost toho, co nakonec vygeneruje.
Řekněme, že se chatbota AI zeptáte na něco, na co na základě svého tréninku ve skutečnosti nezná odpověď. Bez RAG by chatbot mohl jen halucinovat špatnou odpověď. S RAG však může zkontrolovat externí zdroje – jako jsou například jiné stránky na internetu – a použít tato data, aby pomohl informovat o své odpovědi.
Čip H100 společnosti Nvidia: Jeden z nejoblíbenějších grafických procesorů (GPU) používaných pro trénink umělé inteligence. Společnosti se dožadují H100, protože je považován za nejlepší pro zvládání zátěže AI oproti ostatním čipům serverové třídy pro AI. Nicméně zatímco mimořádná poptávka po čipech Nvidia ji vynesla mezi nejcennější čipy společností na světě , což by mohlo nahlodat pozici Nvidie na trhu.
Jednotky pro neuronové zpracování (NPU): Specializované procesory v počítačích, tabletech a chytrých telefonech, které mohou v zařízení provádět odvozování umělé inteligence. (Apple používá termín „neuronový engine“.) NPU mohou být při provádění mnoha úkolů na zařízeních s umělou inteligencí efektivnější (například přidávání rozostření pozadí během videohovoru) než CPU nebo GPU.
TOPS: Tento akronym, který znamená „bilion operací za sekundu“, je termín, který používají výrobci technologií, aby se pochlubili, jak jsou jejich čipy schopné odvozovat umělou inteligenci.
Existuje mnoho společností, které se staly lídry ve vývoji AI a nástrojů využívajících AI. Některé z nich jsou etablovaní technologičtí giganti, ale jiné jsou novější startupy. Zde je několik z těchto hráčů:
OpenAI / ChatGPT: Důvodem, proč je AI nyní tak velkým tématem, je pravděpodobně ChatGPT, chatbot s umělou inteligencí, který OpenAI uvolnila koncem roku 2022 služby do značné míry zaskočil velké technologické hráče a nyní se téměř každá další technologická společnost snaží pochlubit svými schopnostmi v oblasti AI.
Microsoft / Copilot: Microsoft zapéká Copilota, svého AI asistenta využívajícího modely GPT od OpenAI, do co největšího počtu produktů. Technologický gigant ze Seattlu má také 49% podíl v OpenAI.
Google / Gemini: Google se předhání v tom, aby své produkty vybavil technologií Gemini, která označuje jak asistenta umělé inteligence této společnosti, tak i její asistentku.
Meta / Llama: Úsilí společnosti Meta v oblasti umělé inteligence se točí kolem jejího modelu Llama (Large Language Model Meta AI), který je na rozdíl od modelů jiných velkých technologických společností otevřený.
Apple / Apple Intelligence: Apple přidává do svých produktů nové funkce zaměřené na umělou inteligenci pod hlavičkou Apple Intelligence. Jednou z velkých novinek je dostupnost ChatGPT přímo v Siri.
Anthropic / Claude: Anthropic je společnost založená bývalými zaměstnanci OpenAI, která vytváří modely umělé inteligence Claude. Amazon do společnosti investoval 4 miliardy dolarů, zatímco Google stovky milionů. Nedávno najala spoluzakladatele Instagramu Mikea Kriegera jako svého produktového ředitele.
xAI / Grok: Jedná se o společnost Elona Muska, která se zabývá umělou inteligencí a vyrábí Grok, LLM. Nedávno získala finanční prostředky ve výši 6 miliard dolarů.
Perplexity: Perplexity je další společností zabývající se umělou inteligencí. Je známá svým vyhledávačem poháněným umělou inteligencí, který se dostal pod drobnohled kvůli zdánlivě podezřelým praktikám šrotování.
Hugging Face: Jde o platformu, která slouží jako adresář modelů a datových souborů umělé inteligence.