Mis annab jõudu OpenAI robotile, mis võitis Dendi
Miscellanea / / December 02, 2021
Eelmisel nädalal oli ajalugu loodud Dota 2 ja AI valdkondades. Rahvusvahelises, Dendi, üks mängu parimaid mängijaid, peksti kaks korda järjest halastamatult 1v1, boti poolt. Kõnealuse roboti tegi OpenAI, Elon Muski idufirma.
Nüüd võib teil tekkida küsimusi. Mis on Dota? Mis on OpenAI? Ja miks see üldse oluline on? Alustuseks, Dota on tasuta mängitav MOBA mäng, mida juhite Kangelased ja teie eesmärk on hävitada vastased Iidne. Paljud Dota fännid võivad viimase lauseni solvuda, kuna Dotast on nii palju, siis olen kokku võtnud.
Mäng on väga keeruline väga järsu õppimiskõveraga. Olin mõni aeg tagasi asunud Dota õppimise missioonile ja mul kulus nädal, et läbida põhi Kuidas video, kus nad selgitavad mängu strateegiat, mida relvi, loitsusid, kangelasi teevad ja kuidas judinaid kaevandada. Ja see teebki terviku AI vs Dendi lahing on oluline, sest see illustreerib, kui arenenud on AI ja ML. Nii et vaatame, mis seda robotit toidab ja kas me peame AI ülestõusu pärast kartma.
AI planeedi tõus
AI muutumine Skynetiks on vaieldav probleem. Elon Musk
usub et kui ei hoita kontrolli all, a Skynet sarnane stsenaarium tõenäoliselt juhtub. Teiselt poolt, Mark Zuckerbergütleb et AI on kahjutu ega põhjusta viimsepäeva stsenaariumit. Selle eesmärgiga alustas OpenAI-d Elon Musk.Et vältida tehisintellekti väärkasutamist ja tehisintellekti uurimist, mis ei pöördu meie vastu. Ja ma olen tema poolel.
Kuid me ei ole siin selleks, et arutada. Peamine teema on teada, mis OpenAI loodud roboti toidab. Et sellest aru saada, lugesin selleteemalisi uurimistöid ja ajaveebe ning võtsin ühendust ka oma sõbragaAnmol Sharma kes on AI ja ML uurija.
Tugevdusõpe
See on OpenAI Dota roboti taga oleva tehnoloogia nimi. Kuid enne sellesse süvenemist peame mõistma, kui üldine AI või konkreetselt AI on Videomängud tööd. AI on väga levinud termin ja sisaldab paljusid teemasid, nagu masinõpe, süvaõpe ja närvivõrgud. AI jämedalt määratlemiseks võime öelda, et see on arvuti võime teabest õppida ja selle õppimise põhjal otsuseid teha. Mida rohkem ta õpib, seda enam suureneb otsuse õigsus.
Kuidas see erineb tavalistest robotitest?
Üldiselt võivad videomängude robotid tunduda intelligentsed, kuid see pole AI tõeline vorm. Peaaegu kõik need mängude robotid on programmeeritud komplekti alusel Kui.. See.. Siis.. See avaldused. Nad lihtsalt järgivad avaldusi ja tegutsevad avalduses kirjutatud tingimuste alusel.
Eespool tõin väga lihtsa näite. Pärismängudes esinevad avaldused on tingimuste piires palju keerulisemad. Mida paremini määratletud ja üksikasjalikumad need väited on, seda intelligentsem tundub robot olevat.
Preemiad ja karistused
AI lingos nimetatakse seda, mida me nimetame botiks, agendiks. Eesmärk on panna agent õppima kõike, mida me tahame, et ta õpiks. Agent õpib sama meetodi abil, mida teie koer, preemiate ja karistuste kaudu. Kui agent teeb vea, karistatakse seda ja kui ta teeb õige arvamise või annab õige vastuse, premeeritakse. Selle süsteemi kaudu õpib agent seostama toiminguid, mida ta ei peaks tegema, et vältida karistust, ja sooritama tegevust (või sarnast tegevust), mis annab tasu.
Kui sellele tähelepanelikult järele mõelda, on see täpselt nagu teatud tingimustel põhinevate otsuste tegemine, täpselt nagu algoritmid seda teevad. Nagu ma eespool näitasin, tegutseb plahvatusohtlikule tünnile sattunud mängubot algoritmi järgi. AI algoritmid on ilmselgelt sellest palju keerulisemad, mis muudab kogu süsteemi intelligentne.
Vastavalt meie OpenAI robotile arendajad, õppis see ära kogu mängu 2 nädalaga. Kogu 2 nädala jooksul oli see võrgus 24 × 7 ja mängis enda koopia vastu. See on märkimisväärne verstapost, arvestades mängu keerukust ja asjaolu, et see võib ületada Dendi.
Miks juhita autosid ikka veel pole?
See oli üks esimesi küsimusi, mis mulle kogu sellest sündmusest kuuldes pähe tuli. Kui bot saab sellise mängu selgeks õppida ja end tippmängijatest võitma treenida, siis miks me ikkagi rooli mehitame. Ja see oli sama küsimus, mille esitasin oma sõbrale, Härra Anmol Sharma, kes on uurinud ka sõiduta autode kohta. Seda oli tal öelda.
Mängus, mille on välja töötanud inimene, on muutujate arv väiksem. Lisaks, kui agent (bot) eksib, on halvim karistus ümmargune kaotus. Päris maailmas on üks viga surm.
Kuigi Dota on keeruline mäng, on võimalikud käikude, loitsude ja taktikate kombinatsioonid, kuigi need on absurdselt suured, siiski piiratud. Ja eksimused on lubatud ilma reaalse karistuseta. Kuid juhita auto korral võivad vead põhjustada ohtlikke õnnetusi ja isegi surma.
Reaalses maailmas on muutujate arv, mida agent peab jälgima, lõputu ja olukordi tekib seetõttu neid muutujaid, nagu äkitselt sõidurada vahetav teine auto, auto ette hüppav jalakäija, on samuti lõputult. Lisaks nagu Jeremy Clarkson sõnastage, et nad peavad otsekohe õnnetuse äärel langetama moraalseid ja eetilisi otsuseid (kuigi tema teooria ei kehti).
Tulevik
Me juba teame, et inimese juhitav robot teeb sisemisi operatsioone. Järgmine hüpe on seda teostavad AI-juhitavad robotid. Ja see on ainult meditsiini valdkonnas. AI on järgmisel kümnendil paljudes valdkondades kindlasti domineeriv uus tehnoloogia. Kuid tehisintellekti saab kuritarvitada ka pahatahtlikel eesmärkidel, näiteks DDoS rünnakud, Lunavara Robotid ja muude arvutite või ettevõtete süsteemide häkkimine.
Dota ja teiste mängude osas võib oodata, et ka teiste mängude jaoks tehakse selliseid intelligentseid roboteid, mille vastu mängijad saavad treenida, et veelgi paremini esineda. Ja kas ma mainisin, et OpenAI teeb järgmise aasta rahvusvahelisel võistlusel 5v5? Nii et ma asun oma Dota oskusi täiendama, et vähemalt sisseehitatud lollimad robotid võita. Jumalik rapiir siit ma tulen!