Ce alimentează botul OpenAI care l-a învins pe Dendi
Miscellanea / / December 02, 2021
Săptămâna trecută, istoria a fost creată în tărâmurile Dota 2 și AI. La International, Dendi, unul dintre cei mai buni jucători ai jocului, a fost învins fără milă într-un 1v1, de un bot, de două ori la rând. Botul în cauză a fost realizat de OpenAI, un startup al lui Elon Musk.
![Deschide Aibot Vs Dendi Dota2 Small](/f/db22159d064a71b80ed0d00169b7d4d7.png)
Acum este posibil să aveți câteva întrebări. Ce este Dota? Ce este OpenAI? Și de ce este asta chiar important? A începe cu, Dota este un joc MOBA gratuit în care controlezi Eroii iar scopul tău este să distrugi adversarii Vechi. Mulți fani Dota s-ar putea jigni de ultima propoziție, deoarece există atât de multe pentru Dota, apoi am rezumat.
Jocul este foarte complex cu o curbă de învățare foarte abruptă. Mi-am început o misiune de a învăța Dota cu ceva timp în urmă și mi-a luat o săptămână doar să trec printr-un Cum să video, în care explică strategia jocului, ce arme, vrăji, eroi fac și cum să mine strigații. Și asta face întregul AI vs Dendi lupta importantă pentru că ilustrează cât de avansate au devenit AI și ML. Deci, să vedem ce alimentează acel bot și trebuie să ne speriem de revolta AI.
Rise of the Planet of the AI
AI care devine Skynet este o problemă discutabilă. Elon Musk crede că dacă nu este ținut în frâu, a Skynet este probabil să se întâmple un asemenea scenariu. Pe de altă parte, Mark Zuckerbergspune că AI este inofensivă și nu va provoca Scenariul Doomsday. Elon Musk a început OpenAI cu acest obiectiv.
Pentru a preveni utilizarea greșită a AI și cercetarea în IA care nu se va întoarce împotriva noastră. Și eu sunt de partea lui.
Dar nu asta suntem aici pentru a discuta. Subiectul principal este să știți ce alimentează botul creat de OpenAI. Pentru a înțelege, am citit câteva lucrări de cercetare și bloguri pe acest subiect și am contactat și prietenul meuAnmol Sharma care este cercetător AI și ML.
Consolidarea învățării
Acesta este numele tehnologiei din spatele botului Dota al OpenAI. Dar înainte de a aprofunda în el, trebuie să înțelegem cât de generală intervine AI, sau în mod specific Jocuri video muncă. AI este un termen foarte comun și conține multe subiecte, cum ar fi învățarea automată, învățarea profundă și rețelele neuronale, pentru a numi câteva. Pentru a defini grosier AI, putem spune că este capacitatea unui computer de a învăța din informații și de a lua decizii pe baza învățării sale. Cu cât învață mai mult, cu atât corectitudinea deciziei crește.
Cum este diferit de botul normal?
Boții din jocurile video în general pot părea inteligenți, dar nu este o formă adevărată de AI. Aproape toți acești roboți din jocuri sunt programați în funcție de set Dacă.. Acest.. Atunci.. Acea declarații. Ei doar urmează declarațiile și iau măsuri pe baza condițiilor scrise în declarație.
![Exemplu de programare Ai Bot](/f/937cfce251e94e79e61098a505c31344.png)
Mai sus am arătat un exemplu foarte simplu. Declarațiile din jocurile reale sunt mult mai complexe cu condiții în condiții. Cu cât aceste afirmații sunt mai bine definite și detaliate, cu atât botul va părea mai inteligent.
Recompense și pedepse
În limbajul AI, ceea ce numim ca bot este cunoscut ca agent. Scopul este de a face agentul să învețe tot ceea ce dorim să învețe. Agentul învață prin aceeași metodă ca și câinele tău, prin recompense și pedepse. Ori de câte ori agentul greșește, acesta este penalizat și ori de câte ori face o presupunere corectă sau dă răspunsul corect, este recompensat. Prin acest sistem, agentul învață să asocieze acțiunile pe care nu ar trebui să le facă pentru a evita penalizarea și să efectueze acțiunea (sau acțiuni similare) care oferă recompense.
![start](/f/6b38e4de0ad451d1c8f48252a814a658.png)
Dacă te gândești îndeaproape, este ca și cum ai lua o decizie bazată pe anumite condiții, la fel cum o fac algoritmii. După cum am arătat mai sus, un bot de joc, care se întâlnește cu un butoi exploziv, va lua acțiuni conform algoritmului. Algoritmii din AI, evident, sunt extrem de complexi decât asta, ceea ce face întregul sistem inteligent.
Venind la botul nostru OpenAI, conform dezvoltatori, a învățat întregul joc în timp de 2 săptămâni. Pe parcursul a 2 săptămâni, a fost online 24×7 și a jucat împotriva unei copii a lui. Este o piatră de hotar remarcabilă, având în vedere complexitatea jocului și faptul că ar putea depăși Dendi.
De ce mașinile fără șofer încă nu sunt aici?
Aceasta a fost una dintre primele întrebări care mi-a apărut în minte când am auzit despre acest eveniment. Dacă un bot poate învăța un astfel de joc și se poate antrena până la un punct de a învinge jucătorii de top, de ce încă ne ocupăm de roată. Și aceasta a fost aceeași întrebare pe care am trimis-o prietenului meu, domnule Anmol Sharma, care a cercetat și mașinile fără mașină. Asta a avut de spus.
Într-un joc, care este dezvoltat de un om, numărul de variabile este mai mic. În plus, dacă agentul (bot) face o greșeală, cea mai grea penalizare este o pierdere rundă. În lumea reală, o greșeală este moartea.
Chiar dacă Dota este un joc complex, posibilele combinații de mișcări, vrăji și tactici, deși încă absurd de mari, sunt încă limitate. Și greșelile sunt permise fără nicio penalizare reală. Dar în cazul unui agent auto fără șofer, greșelile pot duce la accidente periculoase și chiar la moarte.
![Waymo Car 2017 Mic](/f/61e961a8e4edffbcacd3f423998a263d.png)
În lumea reală, numărul de variabile pe care agentul trebuie să le monitorizeze este nesfârșit și din cauza situațiilor apar aceste variabile, cum ar fi o altă mașină care își schimbă brusc banda, pietonul care sări în fața mașinii, sunt, de asemenea, nesfârșite. Plus ca Jeremy Clarkson pe scurt, vor trebui să ia decizii morale și etice atunci când sunt în pragul unui accident imediat (deși teoria lui nu este valabilă).
Viitorul
Știm deja despre robotul controlat uman care efectuează intervenții chirurgicale intrinseci. Următorul salt îl realizează roboții controlați de AI. Și asta este doar în domeniul medical. AI va fi cu siguranță noua tehnologie dominantă în următorul deceniu în multe domenii. Dar, AI poate fi folosită greșit și în scopuri nefaste, cum ar fi DDoS atacuri, Ransomware Boti și hacking alte PC-uri sau sisteme ale corporațiilor.
![Tay dna](/f/6cdf26a811b48a4134c15b0a217dfbf9.png)
În ceea ce privește Dota și alte jocuri, ne putem aștepta să vedem astfel de roboți inteligenți făcuți și pentru alte jocuri, împotriva cărora jucătorii se pot antrena pentru a performa și mai bine. Și am menționat că OpenAI va face un 5v5 la International de anul viitor? Așa că sunt pe cale să-mi perfecționez abilitățile Dota pentru a învinge cel puțin roboții mai proști încorporați. Sabie divină aici vin!