Google Bard – přelomová umělá inteligence nebo jen marketingový trik?

Umělá inteligence a její použití > Zajímavosti > AI příspěvky > Google Bard – přelomová umělá inteligence nebo jen marketingový trik?

Google Bard – přelomová umělá inteligence nebo jen marketingový trik?

Google Bard je experimentální konverzační služba umělé inteligence oznámená společností Google v únoru 2023. Na základě LaMDA (Language Model for Dialogue Applications) si Bard klade za cíl poskytovat užitečné informace na dotazy uživatelů pomocí přirozených konverzací.

Google původně spustil Barda jako chatbota, který mohl vést textové konverzace na téměř jakékoli téma. Uživatelé mohli klást Bardovi náročné otázky a dostávat promyšlené odpovědi pocházející z webu. V prvních dnech po spuštění však byly některé Bardovy odpovědi nepřesné nebo nevhodné, což zdůrazňovalo omezení současných schopností umělé inteligence.

Bard představuje ambiciózní úsilí společnosti Google stát se v čele vývoje velkých jazykových modelů. Zatímco původní verze čelí kritice, zdá se, že Google je odhodlán rychle tuto technologii vylepšit. Tento článek se zaměřuje na snahy společnosti Google zlepšit Bard prostřednictvím dalšího školení, kontroly kvality a integrace zpětné vazby od lidí.

Základní informace o velkých jazykových modelech

Velké jazykové modely (LLM), jako je Google Bard, jsou typem systému umělé inteligence trénovaného na obrovském množství textových dat. LLM jako Bard jsou postaveny na základních modelech, jako je GPT-3, který byl vytvořen společností Anthropic a obsahuje 175 miliard parametrů.

Parametry odkazují na „nastavení“, která model strojového učení upravuje během tréninku, aby optimalizoval své předpovědi. Obecně platí, že více parametrů vede k větší schopnosti, což LLM umožňuje porozumět složitějším konceptům a generovat koherentnější text.

LLM jako GPT-3 jsou trénováni na obrovských souborech dat stažených z internetu, včetně webových stránek, knih, Wikipedie a dalších. To vystavuje model široké škále příkladů přirozeného jazyka, ze kterých se lze učit. To však také znamená, že jakékoli zkreslení v trénovacích datech se absorbuje do modelu.

Výhody velkých jazykových modelů:

  • Působivé schopnosti zpracování přirozeného jazyka
  • Dokáže odpovídat na otázky, sumarizovat text, překládat jazyky, psát kreativně a další
  • Dobře škálujte s více daty a parametry
  • Všestranný – lze jej doladit pro konkrétní úkoly

Nevýhody velkých jazykových modelů:

  • Sklon k halucinacím – vymýšlení věrohodných, ale nesprávných informací
  • Udržujte předsudky v trénovacích datech
  • Chybí zdravý rozum a bojuje se složitým uvažováním
  • Netransparentní ohledně silných stránek a omezení

LLM jsou slibné, ale při neopatrném nasazení také přinášejí rizika. Stejně jako u každého systému umělé inteligence je rozhodující odpovědný návrh. Probíhající výzkum si klade za cíl vyvinout metody, které udrží schopnosti a zároveň sníží škody.

První zpětná vazba na Barda

Navzdory humbuku a nadšení kolem spuštění Google Bard, první zpětná vazba od uživatelů upozornila na některé problémy se schopnostmi chatbota. Jednou z nejčastějších stížností bylo, že Bard poskytl věcně nesprávné odpovědi na určitá témata, aniž by naznačoval, že informace mohou být nepřesné.

Například na jednoduché otázky, které by měly mít definitivní věcné odpovědi, Bard odpověděl smyšlenými statistikami nebo podrobnostmi, které nebylo možné ověřit z jiných zdrojů. To vyvolalo obavy ze spoléhání se na Barda v případě jakýchkoli informací, které vyžadovaly přesná fakta nebo data.

S tímto problémem souvisel Bardův nedostatek citací pro informace, které poskytl. Když Bard odpovídal na mnoho otázek, neuvedl žádné odkazy ani neuvedl, odkud čerpá fakta, citace a čísla. To uživatelům znemožnilo zkontrolovat přesnost a důvěryhodnost Bardových odpovědí. Bez jakýchkoli citací byli uživatelé ponecháni, aby Bardovo slovo brali jako nominální hodnotu.

Nedostatek citací spojený s širším problémem Barda, jak se zdá, „vytvářel“ odpovědi, které zněly přesvědčivě, ale nebylo možné je ověřit. Zatímco člověkem psané encyklopedické záznamy a akademické články obsahují vložené citace umožňující čtenářům dohledat zdroj informací, Bardovy odpovědi nechaly uživatele slepě věřit jeho schopnostem. Dřívější recenze naznačovaly, že bylo zapotřebí mnohem více práce, než se na Barda dalo spolehnout jako na autoritativní zdroj srovnatelný s lidským výzkumem a analýzou.

Odpověď společnosti Google

Google uznal omezení Bard při uvedení na trh a zavázal se k přísnému testování.

Krátce po rockovém debutu robota převzal generální ředitel Google Sundar Pichai odpovědnost za jeho nedostatky a řekl: „Bardovo spuštění nám připomíná, abychom byli pokorní ohledně toho, kde je dnes AI.“ Připustil, že technologie má stále problémy s pochopením širších souvislostí.

Pichai nastínil plán Googlu shromáždit zpětnou vazbu od uživatelů během „odlehčeného spuštění“, aby mohli pokračovat ve zlepšování Bardových schopností v nadcházejících měsících. Prvotní vydání má za cíl oslovit omezený počet testerů, aby výzkumníci AI společnosti Google mohli pozorně sledovat výkon v reálném světě.

Tato experimentální fáze umožní Bardovi vyškolit se na různé otázky a zpětnou vazbu. Jak jsou modely vystaveny většímu množství dat od skutečných uživatelů, přesnost a relevance by se měly neustále zvyšovat. Google očekává, že s rostoucí robustností systému rozšíří přístup.

Pichai požádal o trpělivost, ale slíbil, že společnost Google bude zodpovědná za to, jak budou provádět Bardovy testy. Řekl, že jsou odhodláni držet vysokou laťku kvality, bezpečnosti a být založeni na skutečných důkazech. Google se snaží zkombinovat hlubokou počítačovou vědu se silnými testovacími metodami, aby zajistil, že Bard naplno využije svůj potenciál.

Konkrétní vylepšení

Po obdržení zpětné vazby z prvního spuštění se Google zaměřil na konkrétní vylepšení Barda, aby vyřešil některé problémy, které byly zdůrazněny.

Jednou z klíčových oblastí je rozšiřování Bardovy znalostní báze. Zatímco velké jazykové modely, jako je Bard, byly trénovány na obrovském množství textových dat, v jejich znalostech jsou nevyhnutelně mezery. Google doufá, že začleněním strukturovanějších dat do Bardova školení zaplní některé z těchto mezer a umožní Bardovi poskytovat přesnější a faktičtější informace.

Google také pracuje na vylepšení Bardových schopností ověřovat fakta. Původní model někdy poskytoval nesprávné informace prezentované jako fakta. Školením Barda, aby lépe vyhodnocoval pravdivost prohlášení a proaktivně poskytoval citace, se Google snaží učinit Bardovy odpovědi důvěryhodnější.

S ověřováním faktů souvisí přidávání citací. Společnost Bard nyní při poskytování určitých typů faktických informací zahrnuje inline citace z renomovaných zdrojů. Uživatelé tak mohou sami zkontrolovat zdroj a správnost informací. Poskytování citací je důležitým způsobem, jak učinit Bard transparentnějším a odpovědnějším.

Celkově toto zaměření na rozšíření Bardových znalostí, zlepšení ověřování faktů a přidávání citací ukazuje, že Google bere zpětnou vazbu k prvnímu spuštění vážně. I když je třeba ještě hodně zapracovat, výsledkem těchto vylepšení by měl být schopnější a spolehlivější Bard.

Probíhající výzvy

Google Bard prokázal působivé schopnosti, ale také čelí neustálým výzvám, protože je stále vyvíjen a rozšiřován. Dvě klíčové výzvy zahrnují vyvážení bezpečnosti a užitečnosti a řízení očekávání uživatelů.

Bezpečnost zůstává nejvyšší prioritou, zvláště když je Bard otevřen více uživatelům. Je potřeba snížit škodlivý obsah a zároveň zachovat Bardovy schopnosti. Mezi strategie patří vylepšení filtrování obsahu, zaměření modelu na konstruktivní dialog a umožnění zpětné vazby od uživatelů. Úplné odstranění rizik je však nepravděpodobné. Uživatelé by měli být opatrní při interakci s Bardem.

Rozhodující bude také řízení očekávání, protože raný marketing vytvořil nerealistické naděje ohledně Bardových schopností. I když je Bard inovativní, má omezení jako každá technologie. Stanovení jasných očekávání, že jde o asistenta AI, nikoli vševědoucího génia, povede k zodpovědnějšímu používání. Transparentnost jeho tréninkového procesu a schopností také pomůže uživatelům pochopit jeho silné a slabé stránky.