Шта покреће ОпенАИ бота који је победио Дендија
Мисцелланеа / / December 02, 2021
Прошле недеље, историја је била створио у областима Дота 2 и АИ. у Тхе Интернатионал, Денди, један од најбољих играча игре, два пута заредом је немилосрдно побеђен у игри 1 на 1 од стране бота. Дотични бот је направио ОпенАИ, стартап Елона Маска.
Сада можда имате нека питања. Шта је Дота? Шта је ОпенАИ? И зашто је ово уопште важно? За почетак, Дота је бесплатна МОБА игра у којој ви контролишете Хероји а ваш циљ је да уништите противнике Древни. Многи фанови Доте могу се увредити до последње реченице јер сам толико сумирао у Доти.
Игра је веома комплекс са веома стрмом кривом учења за то. Пре неког времена сам кренуо у мисију да научим Доту и требало ми је недељу дана да прођем кроз Како да видео, где објашњавају стратегију игре, шта оружје, чаролије, хероји раде и како минирају крипове. И ово чини целину АИ против Денди Битка је важна јер илуструје колико су напредни АИ и МЛ постали. Па хајде да видимо шта покреће тог бота и да ли треба да се плашимо побуне вештачке интелигенције.
Успон планете АИ
АИ постаје Скинет је споран проблем. Елон Муск верује да ако се не држи под контролом, а Скинет сличан сценарио ће се вероватно догодити. С друге стране, Марк Цукербергкаже да је вештачка интелигенција безопасна и да неће изазвати сценарио Судњег дана. Елон Муск је покренуо ОпенАИ са овим циљем.
Да спречимо злоупотребу вештачке интелигенције и истраживање вештачке интелигенције која се неће окренути против нас. И ја сам на његовој страни.
Али то није оно о чему смо овде да бисмо разговарали. Главна тема је знати шта покреће бот који је направио ОпенАИ. Да бих то разумео, прочитао сам неке истраживачке радове и блогове на ту тему и такође контактирао свог пријатељаАнмол Схарма који је истраживач АИ и МЛ.
Учење са појачањем
Ово је име технологије која стоји иза ОпенАИ-овог Дота бота. Али пре него што се удубимо у то, морамо да разумемо како општа вештачка интелигенција, или посебно АИ Видео игрице рад. АИ је веома популаран термин и садржи многе теме као што су машинско учење, дубоко учење и неуронске мреже да споменемо само неке. Да бисмо грубо дефинисали АИ, можемо рећи да је то способност рачунара да учи из информација и доноси одлуке на основу свог учења. Што више учи, то се више повећава његова исправност одлуке.
Како се разликује од нормалног робота?
Ботови у генералним видео играма могу изгледати као да су интелигентни, али то није прави облик АИ. Скоро сви ови ботови у игрицама су програмирани на основу скупа Ако.. Ово.. Онда.. То изјаве. Они само прате изјаве и предузимају радње на основу услова написаних у изјави.
Изнад сам показао врло једноставан пример. Изјаве у стварним играма су много сложеније са условима унутар услова. Што су ове изјаве боље дефинисане и детаљније, бот ће изгледати интелигентнији.
Награде и казне
У АИ жаргону, оно што зовемо бот познато је као агент. Циљ је да агент научи шта год желимо да научи. Агент учи на исти начин као и ваш пас, кроз награде и казне. Кад год агент погреши бива кажњен и кад год тачно погоди или да тачан одговор, награђује се. Кроз овај систем, агент учи да повеже радње које не би требало да ради да би избегао казну и изврши радњу (или сличне радње) које дају награду.
Ако добро размислите о томе, то је као доношење одлука на основу одређених услова, слично као што то раде алгоритми. Као што сам горе показао, бот за игру, који наиђе на експлозивно буре, ће предузети акције према алгоритму. Алгоритми у АИ су очигледно много сложенији од овога, што чини цео систем интелигентан.
Долазимо до нашег ОпенАИ бота, према програмери, научио је целу игру за 2 недеље. Током целог времена од 2 недеље, био је онлајн 24×7 и играо се против своје копије. То је изузетна прекретница с обзиром на сложеност игре и чињеницу да би могла да победи Денди.
Зашто аутомобили без возача још увек нису ту?
Ово је било једно од првих питања које ми је пало на памет када сам чуо за цео овај догађај. Ако бот може да научи такву игру и да се истренира до тачке да победи врхунске играче, зашто ми још увек управљамо точком. И ово је било исто питање које сам упутио свом пријатељу, г. Анмол Шарма, који је такође истраживао аутомобиле без вожње. То је оно што је имао да каже.
У игри, коју је развио човек, број варијабли је мањи. Плус, ако агент (бот) погреши, најгора казна је губитак рунде. У стварном свету, једна грешка је смрт.
Иако је Дота сложена игра, могуће комбинације потеза, чаролија и тактика, иако су и даље апсурдно велике, и даље су ограничене. А грешке су дозвољене без икакве праве казне. Али у случају агента аутомобила без возача, грешке могу довести до опасних несрећа, па чак и смрти.
У стварном свету, број варијабли које агент мора да прати је бесконачан и због њих настају ситуације ове варијабле, попут другог аутомобила који изненада мења траку, пешака који скаче испред аутомобила, такође су бескрајне. Плус, као Џереми Кларксон речено, мораће да донесу моралне и етичке одлуке када су на ивици непосредне несреће (иако његова теорија није валидна).
Будућност
Већ знамо за робота којим управљају људи који изводи унутрашње операције. Следећи скок су роботи који контролишу вештачка интелигенција. А ово је само у области медицине. АИ ће сигурно бити доминантна нова технологија у наредној деценији у многим областима. Али, вештачка интелигенција се такође може злоупотребити у зле сврхе као што су ДДоС напади, Рансомваре Ботови и хаковање других рачунара или система корпорација.
Што се тиче Доте и других игара, можемо очекивати да се такви интелигентни ботови праве и за друге игре, против којих играчи могу да тренирају да би имали још бољи учинак. И да ли сам споменуо да ће ОпенАИ радити 5 на 5 на Међународном такмичењу следеће године? Зато идем да усавршавам своје Дота вештине да бих бар победио уграђене глупље ботове. Божански рапир долазим!