Co pohání OpenAI bota, který porazil Dendiho
Různé / / December 02, 2021
Minulý týden byla historie vytvořené v říších Dota 2 a AI. V The International, Dendi, jeden z nejlepších hráčů hry, byl dvakrát za sebou nemilosrdně poražen v 1v1 botem. Dotyčného robota vytvořil OpenAI, startup Elona Muska.
Nyní můžete mít nějaké otázky. Co je Dota? Co je OpenAI? A proč je to vůbec důležité? Začít, Dota je free-to-play MOBA hra, ve které ovládáte hrdinové a vaším cílem je zničit protivníky Starověký. Mnoho fanoušků Doty se může urazit kvůli poslední větě, protože v Dotě je toho tolik, než jsem shrnul.
Hra je velmi komplex s velmi strmou křivkou učení. Před časem jsem se vydal na misi naučit se Dota a trvalo mi týden, než jsem prošel základní Jak video, kde vysvětlují strategii hry, jaké zbraně, kouzla, hrdinové dělají a jak těžit creepy. A tohle tvoří celek AI vs Dendi bitva je důležitá, protože ukazuje, jak pokročilou AI a ML se staly. Pojďme se tedy podívat, co pohání toho robota, a musíme se bát povstání AI.
Vzestup planety AI
AI stát se Skynetem je diskutabilní problém. Elon Musk
věří že pokud nebude držen pod kontrolou, a Skynet podobný scénář pravděpodobně nastane. Na druhou stranu, Mark Zuckerbergříká že AI je neškodná a nezpůsobí Doomsday Scenario. Elon Musk zahájil OpenAI s tímto cílem.Abychom zabránili zneužití AI a výzkumu AI, který se neobrátí proti nám. A já jsem na jeho straně.
Ale to není to, o čem jsme tady, abychom diskutovali. Hlavním tématem je vědět, co pohání robota vytvořeného OpenAI. Abych tomu porozuměl, přečetl jsem si několik výzkumných prací a blogů na toto téma a také jsem kontaktoval svého příteleAnmol Sharma který je výzkumníkem AI & ML.
Posílení učení
Toto je název technologie, která stojí za botem Dota OpenAI. Než se do toho ale ponoříme, musíme pochopit, jak obecná AI, nebo konkrétně AI, funguje Videohry práce. AI je velmi obecný termín a obsahuje mnoho témat, jako je strojové učení, hluboké učení a neuronové sítě, abychom jmenovali alespoň některé. Pro hrubou definici AI můžeme říci, že je to schopnost počítače učit se z informací a rozhodovat se na základě svého učení. Čím více se učí, tím více roste jeho správnost rozhodnutí.
Jak se liší od normálních botů?
Boti obecně ve videohrách mohou vypadat jako inteligentní, ale není to skutečná forma umělé inteligence. Téměř všichni tito roboti ve hrách jsou naprogramováni na základě sady Li.. Tento.. Pak.. Že prohlášení. Pouze se řídí prohlášeními a podnikají kroky na základě podmínek uvedených v prohlášení.
Výše jsem ukázal velmi jednoduchý příklad. Příkazy ve skutečných hrách jsou mnohem složitější s podmínkami v podmínkách. Čím přesněji a podrobněji tato prohlášení budou, tím více se bude bot jevit jako inteligentní.
Odměny a tresty
V žargonu umělé inteligence se tomu, čemu říkáme bot, říká agent. Cílem je, aby se agent naučil vše, co chceme, aby se naučil. Agent se učí stejnou metodou, jakou se učí váš pes, prostřednictvím odměn a trestů. Kdykoli agent udělá chybu, je penalizován a kdykoli uhodne správně nebo dá správnou odpověď, je odměněn. Prostřednictvím tohoto systému se agent naučí spojovat akce, které by neměl dělat, aby se vyhnul penalizaci, a provést akci (nebo podobné akce), které dávají odměny.
Pokud se nad tím důkladně zamyslíte, je to jako dělat rozhodnutí na základě určitých podmínek, podobně jako to dělají algoritmy. Jak jsem ukázal výše, herní robot, který narazí na výbušný sud, provede akce podle algoritmu. Algoritmy v AI jsou samozřejmě mnohem složitější než toto, což dělá celý systém inteligentní.
Přicházíme k našemu botovi OpenAI, podle vývojáři, naučilo se celou hru za 2 týdny. Po celou dobu 2 týdnů byla online 24×7 a hrála proti své kopii. To je pozoruhodný milník vzhledem ke složitosti hry a skutečnosti, že by mohla překonat Dendi.
Proč tu stále nejsou auta bez řidiče?
To byla jedna z prvních otázek, která mě napadla, když jsem se o celé této události dozvěděl. Pokud se bot může naučit takovou hru a vytrénovat se tak, že porazí špičkové hráče, proč pořád řídíme volant? A to byla stejná otázka, kterou jsem střelil na svého přítele, Pane Anmol Sharma, který také zkoumal auta bez pohonu. Tohle musel říct.
Ve hře, kterou vyvinul člověk, je počet proměnných menší. Navíc, pokud agent (bot) udělá chybu, nejhorší penalizací je prohra v kole. V reálném světě je jednou chybou smrt.
I když je Dota komplexní hrou, možné kombinace pohybů, kouzel a taktiky, i když stále absurdně velké, jsou stále omezené. A chyby jsou povoleny bez skutečného postihu. Ale v případě agenta auta bez řidiče mohou chyby vést k nebezpečným nehodám a dokonce i ke smrti.
V reálném světě je množství proměnných, které musí agent sledovat, nekonečné a situace nastává tyto proměnné, jako jiné auto náhle změní jízdní pruh, chodec skáče před auto, jsou také nekonečné. Navíc jako Jeremy Clarkson Řekněme, že budou muset činit morální a etická rozhodnutí, když budou na pokraji bezprostřední nehody (ačkoli jeho teorie neplatí).
Budoucnost
Již víme, že člověkem ovládaný robot prováděl vnitřní operace. Dalším skokem je provedení robotů řízených umělou inteligencí. A to je jen v oblasti medicíny. AI bude určitě dominantní novou technologií v příštím desetiletí v mnoha oblastech. Ale umělá inteligence může být také zneužita k nekalým účelům, jako je např DDoS útoky, Ransomware Boti a hackování jiných počítačů nebo systémů korporací.
Pokud jde o Dota a další hry, můžeme očekávat, že takové inteligentní roboty budou vyráběny i pro jiné hry, proti kterým mohou hráči trénovat, aby podávali ještě lepší výkon. A zmínil jsem se, že OpenAI bude hrát 5v5 na příštím ročníku International? Takže jdu oprášit své dovednosti Dota, abych alespoň porazil vestavěné hloupější roboty. Božský rapír přicházím!