Kas suteikia „OpenAI“ robotui, kuris įveikia Dendi
Įvairios / / December 02, 2021
Praėjusią savaitę istorija buvo sukurtas Dota 2 ir AI srityse. „The International“, Dendi, vienas geriausių žaidimo žaidėjų, du kartus iš eilės buvo negailestingai sumuštas 1 prieš 1, boto. Aptariamą robotą pagamino OpenAI, Elono Musko startuolis.
Dabar jums gali kilti klausimų. Kas yra Dota? Kas yra OpenAI? Ir kodėl tai net svarbu? Pradėti su, Dota yra nemokamas MOBA žaidimas, kurį valdote jūs Herojai ir jūsų tikslas yra sunaikinti priešininkus Senovės. Daugelis Dota gerbėjų gali įsižeisti iki paskutinio sakinio, nes Dota tiek daug, ką aš apibendrinau.
Žaidimas labai kompleksas su labai stačia mokymosi kreive. Prieš kurį laiką buvau pradėjęs misiją išmokti Dota ir man prireikė savaitės, kol išmokau pagrindinį Kaip vaizdo įrašas, kuriame paaiškinama žaidimo strategija, kokie ginklai, burtai, herojai veikia ir kaip išminuoti šliaužtinukus. Ir tai sudaro visumą AI prieš Dendi mūšis yra svarbus, nes jis parodo, kaip pažengė AI ir ML. Taigi pažiūrėkime, kas maitina tą robotą ir ar mums reikia išsigąsti dėl AI sukilimo.
AI planetos kilimas
AI tapimas „Skynet“ yra diskutuotina problema. Elonas Muskas tiki kad jei nekontroliuojamas, a Skynet panašus scenarijus gali įvykti. Iš kitos pusės, Markas Zuckerbergassako kad AI yra nekenksmingas ir nesukels Doomsday scenarijaus. Elonas Muskas pradėjo „OpenAI“ su šiuo tikslu.
Užkirsti kelią piktnaudžiavimui dirbtiniu intelektu ir dirbtinio intelekto tyrimus, kurie neatsisuks prieš mus. Ir aš esu jo pusėje.
Bet mes čia ne apie tai diskutuoti. Pagrindinė tema yra žinoti, kas maitina OpenAI sukurtą robotą. Kad suprasčiau tai, perskaičiau keletą mokslinių darbų ir tinklaraščių šia tema, taip pat susisiekiau su savo drauguAnmol Sharma kuris yra AI ir ML tyrinėtojas.
Sustiprinimo mokymasis
Tai yra OpenAI Dota roboto technologijos pavadinimas. Tačiau prieš gilindamiesi į tai, turime suprasti, koks yra bendras AI arba konkrečiai AI Kompiuteriniai žaidimai dirbti. AI yra labai paprastas terminas ir apima daugybę temų, tokių kaip mašininis mokymasis, gilus mokymasis ir neuroniniai tinklai. Grubiai apibrėžiant AI galime pasakyti, kad tai kompiuterio gebėjimas mokytis iš informacijos ir priimti sprendimus remiantis jos mokymusi. Kuo daugiau jis išmoksta, tuo labiau didėja sprendimo teisingumas.
Kuo jis skiriasi nuo įprastų robotų?
Apskritai vaizdo žaidimų robotai gali atrodyti kaip protingi, tačiau tai nėra tikroji AI forma. Beveik visi šie robotai žaidimuose yra užprogramuoti pagal rinkinį Jei.. Tai.. Tada.. Tai pareiškimus. Jie tiesiog vadovaujasi teiginiais ir imasi veiksmų pagal pareiškime įrašytas sąlygas.
Aukščiau parodžiau labai paprastą pavyzdį. Teiginiai tikruose žaidimuose yra daug sudėtingesni, atsižvelgiant į sąlygas. Kuo geriau apibrėžti ir išsamesni šie teiginiai, tuo robotas atrodys protingesnis.
Apdovanojimai ir bausmės
AI kalboje tai, ką vadiname botu, yra žinoma kaip agentas. Tikslas yra priversti agentą išmokti visko, ko mes norime, kad jis išmoktų. Agentas mokosi naudodamas tą patį metodą, kaip mokosi jūsų šuo, naudodamas atlygį ir bausmes. Kai agentas padaro klaidą, jis yra baudžiamas, o kai jis teisingai spėja arba pateikia teisingą atsakymą, jis yra apdovanotas. Per šią sistemą agentas išmoksta susieti veiksmus, kurių jis neturėtų daryti, kad išvengtų bausmės, ir atlikti veiksmą (ar panašius veiksmus), duodančius atlygį.
Jei gerai pagalvoji, tai panašu į sprendimų priėmimą pagal tam tikras sąlygas, panašiai kaip tai daro algoritmai. Kaip jau parodžiau aukščiau, žaidimų robotas, patekęs ant sprogstamosios statinės, imsis veiksmų pagal algoritmą. Akivaizdu, kad dirbtinio intelekto algoritmai yra labai sudėtingi, o tai sudaro visą sistemą protingas.
Remiantis mūsų OpenAI botu kūrėjai, jis išmoko visą žaidimą per 2 savaites. Visą 2 savaičių laiką jis buvo prisijungęs 24 × 7 ir žaidė prieš savo kopiją. Tai puikus įvykis, atsižvelgiant į žaidimo sudėtingumą ir tai, kad jis gali įveikti Dendi.
Kodėl vis dar nėra automobilių be vairuotojų?
Tai buvo vienas pirmųjų klausimų, kilusių mano galvoje, kai išgirdau apie visą šį įvykį. Jei botas gali išmokti tokio žaidimo ir treniruotis taip, kad nugalėtų geriausius žaidėjus, kodėl mes vis dar valdome vairą. Ir tai buvo tas pats klausimas, kurį uždaviau savo draugui, Ponas Anmol Sharma, kuris taip pat tyrinėjo automobilius be pavarų. Tai jis turėjo pasakyti.
Žmogaus sukurtame žaidime kintamųjų yra mažiau. Be to, jei agentas (botas) suklysta, blogiausia bausmė yra raundo pralaimėjimas. Realiame pasaulyje viena klaida yra mirtis.
Nors Dota yra sudėtingas žaidimas, galimi judesių, burtų ir taktikos deriniai, nors ir absurdiškai dideli, vis dar yra riboti. O klaidos leidžiamos be jokios realios baudos. Tačiau jei automobilis yra be vairuotojo Agentas, klaidos gali sukelti pavojingas avarijas ir net mirtį.
Realiame pasaulyje kintamųjų, kuriuos agentas turi stebėti, skaičius yra begalinis ir dėl to atsiranda situacijų šių kintamųjų, kaip kitas automobilis, staiga persirikiuojantis į eismo juostą, pėstysis šokinėjantis prieš automobilį, taip pat yra begalinis. Be to, kaip Jeremy Clarksonas sakykime, jie turės priimti moralinius ir etinius sprendimus, kai atsidurs tiesioginės avarijos slenkstyje (nors jo teorija negalioja).
Ateitis
Jau žinome apie žmogaus valdomą robotą, atliekantį vidines operacijas. Kitas šuolis – tai atliekantys dirbtinio intelekto valdomi robotai. Ir tai tik medicinos srityje. Artimiausią dešimtmetį dirbtinis intelektas tikrai bus dominuojanti nauja technologija daugelyje sričių. Tačiau AI taip pat gali būti netinkamai naudojamas nešvankiems tikslams, pvz DDoS išpuoliai, Ransomware Botai ir įsilaužimas į kitus asmeninius kompiuterius ar įmonių sistemas.
Kalbant apie „Dota“ ir kitus žaidimus, galime tikėtis, kad tokie išmanūs robotai bus sukurti ir kitiems žaidimams, prieš kuriuos žaidėjai gali treniruotis dar geriau. Ir ar aš minėjau, kad OpenAI kitais metais dalyvaus 5v5? Taigi aš ketinu tobulinti savo Dota įgūdžius, kad bent nugalėtų įmontuotus kvailesnius robotus. Dieviškasis reperis aš ateinu!