Představujeme Gran Turismo Sophy: závodního agenta s umělou inteligencí na úrovni šampiona vytrénovaného s pomocí zpětnovazebního učení
9. února byla oznámena Gran Turismo Sophy, závodní umělá inteligence vyvinutá ve spolupráci společností Polyphony Digital Inc. (PDI), Sony AI a Sony Interactive Entertainment (SIE).
Gran Turismo Sophy byla vytvořena pomocí nejmodernější technologie zpětnovazebního učení vyvinuté společnostmi Sony AI a Gran Turismo a také pomocí rozsáhlého tréninku prostřednictvím cloudové herní infrastruktury společnosti SIE. Tento krok posouvá strojové učení na další úroveň tím, že zavádí agenta umělé inteligence do hyperrealistické simulace závodů, která vyžaduje nepřetržitá rozhodnutí v reálném čase po celou dobu trvání závodu.
Michael Spranger, provozní ředitel umělé inteligence společnosti Sony, popisuje Gran Turismo Sophy jako „agenta umělé inteligence, který se sám naučil řídit na velmi konkurenceschopné úrovni a je schopen postavit se nejlepším jezdcům na světě.“
Agent Gran Turismo Sophy začal jako čistý list papíru a vyvinul se z umělé inteligence, která sotva dokázala na trati udržet přímou linii, v závodníka, který může konkurovat nejlepším jezdcům Gran Turismo Sport na světě.
Gran Turismo Sophy otevírá nové možnosti hraní a zábavy. Níže vysvětlujeme, jak tento vzrušující projekt vznikl.
První skutečný test
Trénink Gran Turismo Sophy začal v dubnu 2020 vytvořením Sony AI. Od tohoto okamžiku tým Sony AI úzce spolupracoval se společností Polyphony Digital na vývoji a zlepšování schopností agenta. První závod „Race Together“ se konal 2. července 2021 a poprvé se v ní agent Gran Turismo Sophy utkal s týmem čtyř z nejlepších lidských jezdců, v čele s trojnásobným šampionem „FIA Gran Turismo Championships“ 2020 Takumou Miyazonem.
V sólových scénářích časovek vykazoval agent Gran Turismo Sophy nadlidskou rychlost a dosahoval rychlejších časů na kolo než lidští jezdci. Závody proti lidem se však ukázaly být jinou výzvou.
„Myslím, že jsme všichni podcenili, jak těžké bude správně zvládnout sportovní stránku věci a naučit se to bez přehnané agresivity nebo ustrašenosti tváří v tvář soupeřům,“ řekl Peter Wurman, ředitel a vedoucí projektů společnosti Sony AI.
Správné závodění
Výkon agenta umělé inteligence je omezen složitostí úkolů, kterým čelí, a Gran Turismo může pro umělou inteligenci představovat velkou výzvu, protože zachycuje dynamiku a fyzikální zákonitosti sportu, zatímco v jiných podobných hrách je závodní fyzikální model zpracován jen částečně.
„Chtěl jsem převést auta a celou kulturu kolem nich do videohry,“ řekl k tomu Kazunori Yamauchi, prezident Polyphony Digital. Charles Ferreira, inženýr společnosti PDI, dodává: „Realismus hry Gran Turismo vychází z detailů, které jsme do hry zanesli – od motoru, pneumatik a odpružení až po tratě a modely vozů.“ Právě takový realismus dělá z této hry jedinečnou výzvu pro umělou inteligenci a dovedl tým Sony AI a Gran Turismo Sophy do nových výšin.
Výcvik s pomocí rozsáhlé infrastruktury
Pomocí techniky zvané zpětnovazební učení se agent Gran Turismo Sophy naučil řídit pomocí pozitivní a negativní zpětné vazby využívající vstupy, jako je rychlost jízdy, směr natočení kol, zakřivení trati atd. Agent Gran Turismo Sophy napodobil způsob, kdy lidé potřebují odhadem více než 10 000 hodin k tomu, aby se zdokonalili v určité dovednosti, zkopíroval sám sebe a projížděl několik různých scénářů najednou. To vyžadovalo velký výpočetní výkon, který poskytla společnost Sony Interactive Entertainment.
„Při standardní simulaci umělé inteligence se vytvoří model a poté se spustí. Proběhne analýza a poté se do této simulace přidají aktualizace a znovu se spustí. Tento proces může být časově velmi náročný,“ řekl Justin Beltran, starší ředitel Future Technology Group, Sony Interactive Entertainment.
„S využitím rozsáhlé celosvětové cloudové herní infrastruktury společnosti SIE však byl agent Gran Turismo Sophy schopen nasadit nejmodernější učební algoritmy a tréninkové scénáře a úspěšně spustit desítky tisíc simultánních simulací v tomto špičkovém prostředí, které podporovalo tuto revoluční technologii,“ pokračoval Beltran.
Návrat na trať
21. října 2021 nadešel druhý závodní den a s ním naděje, že agent Gran Turismo Sophy vyhraje všechny soutěže včetně týmového závodu.
A nejenže dominoval na celé čáře, ale tým byl také svědkem toho, jak se přizpůsobil obtížné situaci, když měl na začátku třetího závodu potíže, a přesto dojel na prvním místě. Ve všech třech závodech získal 1. a 2. místo a v týmovém hodnocení zvítězil o dvojnásobek bodů před lidmi.
Ačkoli GT Sophy prokázal své schopnosti tím, že předstihl lidské jezdce, záměrem tohoto projektu není nahradit nebo omezit lidskou interakci, nýbrž rozšířit a obohatit herní zážitek pro všechny hráče. Sony AI tomu říká „AI pro hráče“. „Vytvoříme umělou inteligenci, která uvolní sílu lidské tvořivosti a představivosti,“ říká Hiroaki Kitano, generální ředitel Sony AI.
„V budoucnu chci s GT Sophy závodit častěji. Od AI agenta jsem se toho opravdu hodně naučil,“ komentoval závod s GT Sophy Takuma Miyazono. „Cílem Gran Turismo Sophy je v konečném důsledku lidi bavit,“ dodal Kazunori Yamauchi, prezident společnosti Polyphony Digital.
„Představujeme si budoucnost, ve které by agenti umělé inteligence mohli vývojářům a tvůrcům představit nové úrovně inovací a otevřít dveře k dosud nezmapovaným příležitostem,“ řekl Ueli Gallizzi, SVP Future Technology Group, Sony Interactive Entertainment. „Mohli bychom být svědky nové úrovně zapojení uživatelů, lepších herních zážitků a vstupu zcela nové generace do světa her.“
Nemůžeme se dočkat, co nás čeká, až se propojí svět umělé inteligence a interaktivní zábavy, a Gran Turismo Sophy je dalším krokem na tomto vzrušujícím dobrodružství.