Nejnovější model umělé inteligence Claude od společnosti Anthropic předbíhá konkurenty od OpenAI a Google. Pokroky v oblasti strojové inteligence jsou však v poslední době spíše přírůstkové než revoluční.
Will Knight, Wired
June 28, 2024
Před necelými dvěma lety odstartovalo spuštění ChatGPT generativní šílenství umělé inteligence. Někteří tvrdili, že tato technologie spustí čtvrtou průmyslovou revoluci, která zcela přetvoří svět, jak ho známe.
V březnu 2023 společnost Goldman Sachs předpověděla, že kvůli umělé inteligenci zanikne nebo znehodnotí 300 milionů pracovních míst. Zdálo se, že dochází k obrovskému posunu.
O osmnáct měsíců později generativní umělá inteligence netransformuje podnikání. Mnoho projektů využívajících tuto technologii bylo zrušeno, například pokus společnosti McDonald’s automatizovat objednávání z auta, který se po komických selháních stal virálním na TikToku. Vládní snahy vytvořit systémy, které by shrnuly veřejné návrhy a vypočítávaly nároky na sociální zabezpečení, potkal stejný osud.
Co se tedy stalo?
Cyklus humbuku kolem umělé inteligence
Stejně jako mnoho nových technologií se i generativní umělá inteligence ubírá cestou známou jako Gartnerův hype cyklus, který poprvé popsala americká technologická výzkumná společnost Gartner.
Tento široce používaný model popisuje opakující se proces, ve kterém počáteční úspěch technologie vede k nafouknutým očekáváním veřejnosti, která se nakonec nepodaří naplnit. Po počátečním „vrcholu nafouknutých očekávání“ přichází „dno deziluze“, následované „svahem osvícení“, který nakonec dosáhne „plošiny produktivity“.
Nedostatky současné generativní technologie umělé inteligence
Zpráva společnosti Gartner zveřejněná v červnu uvedla, že většina generativních technologií umělé inteligence je buď na vrcholu nafouknutých očekávání, nebo stále stoupá. Zpráva tvrdí, že většina těchto technologií je vzdálena dva až pět let od toho, aby se staly plně produktivními.
Bylo vyvinuto mnoho přesvědčivých prototypů generativních produktů umělé inteligence, ale jejich přijetí v praxi bylo méně úspěšné. Studie zveřejněná minulý týden americkým think-tankem RAND ukázala, že 80 % projektů umělé inteligence selhává, což je více než dvojnásobek míry u projektů bez umělé inteligence.
Nedostatky současné generativní technologie umělé inteligence
Zpráva RAND uvádí mnoho problémů s generativní umělou inteligencí, od vysokých investičních požadavků na data a infrastrukturu umělé inteligence až po nedostatek potřebných lidských talentů. Neobvyklá povaha omezení GenAI však představuje zásadní výzvu.
Například generativní systémy umělé inteligence mohou vyřešit některé velmi složité testy při přijímacím řízení na univerzity, ale selhávají ve velmi jednoduchých úkolech. Díky tomu je velmi těžké posoudit potenciál těchto technologií, což vede k falešné důvěře.
Koneckonců, pokud dokáže vyřešit složité diferenciální rovnice nebo napsat esej, měl by být schopen přijímat jednoduché průjezdné příkazy, že?
Nedávná studie ukázala, že schopnosti velkých jazykových modelů, jako je GPT-4, ne vždy odpovídají tomu, co od nich lidé očekávají. Zejména schopnější modely výrazně zaostávaly v případech s vysokými sázkami, kde by nesprávné reakce mohly mít katastrofální následky.
Tyto výsledky naznačují, že tyto modely mohou ve svých uživatelích vyvolat falešnou důvěru. Vzhledem k tomu, že plynule odpovídají na otázky, mohou lidé dospět k příliš optimistickým závěrům o svých schopnostech a nasadit modely v situacích, pro které se nehodí.
Zkušenosti z úspěšných projektů ukazují, že je těžké přimět generativní model, aby se řídil pokyny. Například doučovací systém Khan Academy Khanmigo často odhalil správné odpovědi na otázky, přestože byl instruován, aby to nedělal.
Proč tedy humbuk kolem generativní umělé inteligence ještě neskončil?
Důvodů je několik.
Za prvé, technologie generativní umělé inteligence se navzdory svým výzvám rychle zlepšuje, přičemž hlavními hnacími silami tohoto zlepšení jsou rozsah a velikost.
Výzkum ukazuje, že velikost jazykových modelů (počet parametrů), stejně jako množství dat a výpočetní výkon použitý pro trénování, to vše přispívá ke zlepšení výkonu modelů. Naproti tomu se zdá, že architektura neuronové sítě, která model pohání, má minimální dopad.
Velké jazykové modely také zobrazují tzv. emergentní schopnosti, což jsou neočekávané schopnosti v úlohách, pro které nebyly trénovány. Výzkumníci oznámili, že nové schopnosti se „objevují“, když modely dosáhnou specifické kritické „průlomové“ velikosti.
Studie zjistily, že dostatečně složité velké jazykové modely mohou rozvíjet schopnost uvažovat analogicky a dokonce reprodukovat optické iluze, jaké zažívají lidé. O přesných příčinách těchto pozorování se vedou spory, ale není pochyb o tom, že velké jazykové modely se stávají sofistikovanějšími.
Společnosti zabývající se umělou inteligencí tedy stále pracují na větších a dražších modelech a technologické společnosti jako Microsoft a Apple sázejí na návratnost svých stávajících investic do generativní umělé inteligence. Podle jednoho nedávného odhadu bude muset generativní umělá inteligence produkovat roční příjmy ve výši 600 miliard USD, aby ospravedlnila současné investice – a toto číslo v nadcházejících letech pravděpodobně vzroste na 1 bilion USD.
V tuto chvíli je největším vítězem boomu generativní umělé inteligence společnost Nvidia, největší výrobce čipů, které pohánějí závody ve zbrojení s generativní umělou inteligencí. Jako příslovečný výrobce lopat ve zlaté horečce se Nvidia nedávno stala nejhodnotnější veřejnou společností v historii, když během jediného roku ztrojnásobila cenu svých akcií a v červnu dosáhla ocenění 3 bilionů USD.
Co bude dál?
Vzhledem k tomu, že humbuk kolem umělé inteligence začíná slábnout a my procházíme obdobím deziluze, vidíme také realističtější strategie zavádění umělé inteligence.
Za prvé, umělá inteligence se používá k podpoře lidí, nikoli k jejich nahrazení. Nedávný průzkum mezi americkými společnostmi zjistil, že využívají umělou inteligenci především ke zvýšení efektivity (49 %), snížení nákladů na pracovní sílu (47 %) a zvýšení kvality produktů (58 %)
Za druhé, vidíme také nárůst menších (a levnějších) generativních modelů umělé inteligence, které jsou trénovány na konkrétních datech a nasazeny lokálně, aby se snížily náklady a optimalizovala efektivita. Dokonce i OpenAI, která vedla závod o stále větší modely, vydala model GPT-4o Mini, aby snížila náklady a zlepšila výkon.
Za třetí, vidíme silný důraz na poskytování školení v oblasti gramotnosti v oblasti umělé inteligence a vzdělávání pracovníků o tom, jak umělá inteligence funguje, jaký je její potenciál a omezení a jaké jsou osvědčené postupy pro etické používání umělé inteligence. Je pravděpodobné, že se v nadcházejících letech budeme muset naučit (a znovu se učit), jak používat různé technologie umělé inteligence.
Revoluce v oblasti umělé inteligence bude nakonec vypadat spíše jako evoluce. Jeho využití bude v průběhu času postupně narůstat a postupně měnit a transformovat lidské činnosti. Což je mnohem lepší, než je vyměnit.
Link na článek zde