Što pokreće OpenAI bota koji je pobijedio Dendija
Miscelanea / / December 02, 2021
Prošlog tjedna povijest je bila stvorio u domenama Dote 2 i AI. u The Internationalu, Dendi, jedan od najboljih igrača igre, nemilosrdno je poražen u 1v1, od bota, dva puta zaredom. Dotični bot je napravio OpenAI, startup Elona Muska.
![Open Aibot vs Dendi Dota2 Small](/f/db22159d064a71b80ed0d00169b7d4d7.png)
Sada možda imate pitanja. Što je Dota? Što je OpenAI? A zašto je to uopće važno? Za početak, Dota je besplatna MOBA igra u kojoj vi kontrolirate Heroji a vaš cilj je uništiti protivnike Antički. Mnogi obožavatelji Dote mogu se uvrijediti do zadnje rečenice jer sam sažeo toliko toga o Doti.
Igra je vrlo kompleks s vrlo strmom krivuljom učenja. Prije nekog vremena krenuo sam u misiju učenja Dote i trebalo mi je tjedan dana samo da prođem kroz Kako da video, gdje objašnjavaju strategiju igre, što rade oružje, čarolije, heroji i kako minirati puzave. I ovo čini cjelinu AI protiv Dendi bitna je bitna jer ilustrira koliko su AI i ML postali napredni. Pa da vidimo što pokreće tog bota i trebamo li se bojati pobune umjetne inteligencije.
Uspon planeta AI
AI postaje Skynet je diskutabilan problem. Elon Musk
vjeruje da ako se ne drži pod kontrolom, a Skynet vjerojatno će se dogoditi takav scenarij. S druge strane, Mark Zuckerbergkaže da je umjetna inteligencija bezopasna i da neće uzrokovati scenarij Sudnjeg dana. Elon Musk je pokrenuo OpenAI s tim ciljem.Da spriječimo zlouporabu umjetne inteligencije i istraživanje umjetne inteligencije koja se neće okrenuti protiv nas. I ja sam na njegovoj strani.
Ali to nije ono o čemu smo ovdje da bismo raspravljali. Glavna tema je znati što pokreće bot koji je napravio OpenAI. Da bih to razumio, pročitao sam neke istraživačke radove i blogove na tu temu i također kontaktirao svog prijateljaAnmol Sharma koji je istraživač AI & ML-a.
Učenje s pojačanjem
Ovo je naziv tehnologije iza OpenAI-ovog Dota bota. Ali prije nego što se udubimo u to, moramo razumjeti koliko je AI općenito, ili posebno AI Video igre raditi. AI je vrlo skup pojam i sadrži mnoge teme kao što su strojno učenje, duboko učenje i neuronske mreže da spomenemo samo neke. Da bismo grubo definirali AI, možemo reći da je to sposobnost računala da uči iz informacija i donosi odluke na temelju svog učenja. Što više uči, to se više povećava njegova ispravnost odluke.
Kako se razlikuje od normalnog robota?
Botovi u općenito video igrama mogu izgledati kao da su inteligentni, ali to nije pravi oblik AI. Gotovo svi ovi botovi u igrama programirani su na temelju skupa Ako.. Ovaj.. Zatim.. Da izjave. Oni samo prate izjave i poduzimaju radnje na temelju uvjeta napisanih u izjavi.
![Primjer programiranja Ai Bota](/f/937cfce251e94e79e61098a505c31344.png)
Gore sam pokazao vrlo jednostavan primjer. Izjave u stvarnim igrama su puno složenije s uvjetima unutar uvjeta. Što su ove izjave bolje definirane i detaljnije, to će se bot činiti inteligentnijim.
Nagrade i kazne
U AI žargonu, ono što zovemo bot poznato je kao agent. Cilj je natjerati agenta da nauči sve što želimo da nauči. Agent uči na isti način kao i vaš pas, kroz nagrade i kazne. Kad god agent pogriješi, kažnjava se i kad god ispravno pogodi ili da točan odgovor, nagrađuje se. Kroz ovaj sustav agent uči povezivati radnje koje ne bi trebao činiti kako bi izbjegao kaznu i izvoditi radnju (ili slične radnje) koje daju nagradu.
![Početak](/f/6b38e4de0ad451d1c8f48252a814a658.png)
Ako dobro razmislite o tome, to je kao donošenje odluka na temelju određenih uvjeta, slično kao što to rade algoritmi. Kao što sam gore pokazao, bot za igru, koji naiđe na eksplozivnu bačvu, poduzet će radnje prema algoritmu. Algoritmi u umjetnoj inteligenciji očito su znatno složeniji od ovoga, što čini cijeli sustav inteligentan.
Dolazimo do našeg OpenAI bota, prema programeri, naučio je cijelu igru u roku od 2 tjedna. Tijekom cijelog vremena od 2 tjedna, bio je online 24×7 i igrao protiv svoje kopije. To je izvanredna prekretnica s obzirom na složenost igre i činjenicu da bi se mogla pobijediti Dendi.
Zašto automobili bez vozača još uvijek nisu ovdje?
Ovo je bilo jedno od prvih pitanja koje mi je palo na pamet kada sam čuo za cijeli ovaj događaj. Ako bot može naučiti takvu igru i trenirati se do te mjere da pobijedi vrhunske igrače, zašto još uvijek upravljamo volanom. I ovo je isto pitanje koje sam uputio svom prijatelju, g. Anmol Sharma, koji je također istraživao automobile bez pogona. To je ono što je imao za reći.
U igri koju je razvio čovjek, broj varijabli je manji. Osim toga, ako agent (bot) pogriješi, najgora kazna je gubitak runde. U stvarnom svijetu, jedna greška je smrt.
Iako je Dota složena igra, moguće kombinacije poteza, čarolija i taktika, iako su još uvijek apsurdno velike, još uvijek su ograničene. A greške su dopuštene bez ikakve prave kazne. Ali u slučaju agenta automobila bez vozača, pogreške mogu dovesti do opasnih nesreća, pa čak i smrti.
![Waymo Auto 2017 Mali](/f/61e961a8e4edffbcacd3f423998a263d.png)
U stvarnom svijetu, broj varijabli koje agent mora nadzirati je beskonačan i zbog njih nastaju situacije ove varijable, poput drugog automobila koji iznenada mijenja traku, pješaka koji skače ispred automobila, također su beskrajne. Plus, kao Jeremy Clarkson rečeno, morat će donijeti moralne i etičke odluke kada su na rubu neposredne nesreće (iako njegova teorija nije valjana).
Budućnost
Već znamo za robota kojim upravljaju ljudi koji izvodi unutarnje operacije. Sljedeći skok su roboti kontrolirani umjetnom inteligencijom koji ga izvode. A to je samo u medicinskom području. AI će sigurno biti dominantna nova tehnologija u sljedećem desetljeću na mnogim poljima. Ali, AI se također može zloupotrijebiti u zle svrhe kao što su DDoS napadi, Ransomware Botovi i hakiranje drugih računala ili sustava korporacija.
![Tay gđa](/f/6cdf26a811b48a4134c15b0a217dfbf9.png)
Što se tiče Dote i drugih igara, možemo očekivati da se takvi inteligentni botovi stvaraju i za druge igre, protiv kojih igrači mogu trenirati kako bi imali još bolji učinak. I jesam li spomenuo da će OpenAI odraditi 5 na 5 na Međunarodnom sajmu sljedeće godine? Stoga idem jačati svoje Dota vještine kako bih barem porazio ugrađene gluplje botove. Božanski rapir stižem!