Kaj poganja bota OpenAI, ki premaga Dendi
Miscellanea / / December 02, 2021
Prejšnji teden je bila zgodovina ustvaril na področju Dota 2 in AI. v The International, Dendi, enega najboljših igralcev igre, je dvakrat zapored neusmiljeno premagal bot v 1v1. Zadevnega bota je izdelal OpenAI, startup Elona Muska.
Zdaj boste morda imeli nekaj vprašanj. Kaj je Dota? Kaj je OpenAI? In zakaj je to sploh pomembno? Za začetek, Dota je brezplačna igra MOBA, v kateri nadzorujete Heroji in vaš cilj je uničiti nasprotnike starodavni. Mnogi oboževalci Dote se lahko užalijo do zadnjega stavka, saj je Dota toliko, kot sem povzel.
Igra je zelo zapleteno z zelo strmo krivuljo učenja. Pred časom sem se lotil misije učenja Dote in potreboval sem en teden, da sem opravil osnovno Kako video, kjer razlagajo strategijo igre, kaj počnejo orožja, uroki, junaki in kako rudariti lezenje. In to naredi celoto AI proti Dendi bitka je pomembna, ker ponazarja, kako napredna sta postala AI in ML. Pa poglejmo, kaj poganja tega bota in ali se moramo bati vstaje AI.
Vzpon planeta AI
AI postati Skynet je sporen problem. Elon Musk
verjame da če se ne drži pod nadzorom, a Skynet takšen scenarij se bo verjetno zgodil. Po drugi strani, Mark Zuckerbergpravi da je umetna inteligenca neškodljiva in ne bo povzročila scenarija sodnega dne. Elon Musk je s tem ciljem začel OpenAI.Da preprečimo zlorabo umetne inteligence in raziskave umetne inteligence, ki se ne bodo obrnile proti nam. In jaz sem na njegovi strani.
Ampak to ni tisto, o čemer smo tukaj, da bi razpravljali. Glavna tema je vedeti, kaj poganja bot, ki ga je izdelal OpenAI. Da bi to razumel, sem prebral nekaj raziskovalnih člankov in blogov na to temo in se tudi obrnil na svojega prijateljaAnmol Sharma ki je raziskovalec AI in ML.
Učenje s krepitvijo
To je ime tehnologije, ki stoji za botom Dota OpenAI. Toda preden se poglobimo v to, moramo razumeti, kako je splošna AI ali posebej AI Video igre delo. AI je zelo razširjen izraz in vsebuje veliko tem, kot so strojno učenje, globoko učenje in nevronske mreže, če jih naštejemo le nekatere. Za grobo opredelitev AI lahko rečemo, da je to sposobnost računalnika, da se uči iz informacij in sprejema odločitve na podlagi tega učenja. Bolj ko se uči, bolj se povečuje njegova pravilnost odločitev.
Kako se razlikuje od običajnih botov?
Boti v splošnih video igrah so morda videti, kot da so inteligentni, vendar to ni prava oblika AI. Skoraj vsi ti boti v igrah so programirani na podlagi nabora Če.. Ta.. Potem.. To izjave. Le sledijo izjavam in ukrepajo na podlagi pogojev, zapisanih v izjavi.
Zgoraj sem pokazal zelo preprost primer. Izjave v resničnih igrah so veliko bolj zapletene s pogoji znotraj pogojev. Bolj dobro definirane in podrobne so te izjave, bolj se bo bot zdel inteligenten.
Nagrade in kazni
V jeziku AI je tisto, čemur pravimo bot, znano kot agent. Cilj je, da se agent nauči vsega, kar želimo, da se nauči. Agent se uči na enak način kot se uči vaš pes, z nagradami in kaznimi. Kadarkoli agent naredi napako, je kaznovan in kadar koli pravilno ugane ali poda pravilen odgovor, je nagrajen. S tem sistemom se agent nauči povezati dejanja, ki jih ne bi smel storiti, da bi se izognil kazni, in izvede dejanje (ali podobna dejanja), ki dajejo nagrade.
Če natančno razmislite o tem, je to tako kot sprejemanje odločitev na podlagi določenih pogojev, podobno kot to počnejo algoritmi. Kot sem pokazal zgoraj, bo igralni bot, ki naleti na eksplozivni sod, ukrepal v skladu z algoritmom. Algoritmi v AI so očitno precej zapleteni od tega, kar naredi celoten sistem inteligentni.
Prihaja do našega bota OpenAI, glede na razvijalci, se je v 2 tednih naučil celotne igre. Ves čas 2 tednov je bil na spletu 24×7 in igral proti svoji kopiji. To je izjemen mejnik glede na zapletenost igre in dejstvo, da bi jo lahko premagali Dendi.
Zakaj avtomobilov brez voznika še vedno ni tukaj?
To je bilo eno prvih vprašanj, ki se mi je porodilo, ko sem slišal za celoten dogodek. Če se bot lahko nauči takšne igre in se usposobi do te mere, da premaga vrhunske igralce, zakaj še vedno upravljamo kolo. In to je bilo isto vprašanje, ki sem ga ustrelil svojemu prijatelju, G. Anmol Sharma, ki je raziskoval tudi avtomobile brez vožnje. To je moral povedati.
V igri, ki jo je razvil človek, je število spremenljivk manjše. Poleg tega, če agent (bot) naredi napako, je najhujša kazen izguba v krogu. V resničnem svetu je ena napaka smrt.
Čeprav je Dota zapletena igra, so možne kombinacije potez, urokov in taktik, čeprav še vedno absurdno velike, še vedno omejene. In napake so dovoljene brez prave kazni. Toda v primeru avtomobilskega agenta brez voznika lahko napake povzročijo nevarne nesreče in celo smrt.
V resničnem svetu je število spremenljivk, ki jih mora agent spremljati, neskončno in zaradi njih nastajajo situacije teh spremenljivk, kot je drugi avto, ki nenadoma spremeni pas, pešec, ki skoči pred avto, je prav tako neskončno. Plus, kot Jeremy Clarkson povedano, bodo morali sprejeti moralne in etične odločitve, ko so na robu takojšnje nesreče (čeprav njegova teorija ni veljavna).
Prihodnost
Že poznamo robota, ki ga nadzoruje človek, ki izvaja notranje operacije. Naslednji preskok so roboti, ki jih nadzorujejo AI. In to je samo na področju medicine. AI bo zagotovo prevladujoča nova tehnologija v naslednjem desetletju na številnih področjih. Toda umetna inteligenca se lahko zlorabi tudi za zlobne namene, kot je npr DDoS napadi, Ransomware Boti in vdiranje v druge računalnike ali sisteme korporacij.
V zvezi z Doto in drugimi igrami lahko pričakujemo, da bodo takšni inteligentni boti narejeni tudi za druge igre, proti katerim lahko igralci trenirajo, da bodo še boljši. In ali sem omenil, da bo OpenAI na mednarodnem tekmovanju naslednje leto izvajal 5 proti 5? Zato bom izpopolnjeval svoje Dota veščine, da bi vsaj premagal vgrajene bolj neumne bote. Božanski rapir prihajam!