OpenAI बॉट को क्या शक्ति देता है जो Dendi को मात देता है
अनेक वस्तुओं का संग्रह / / December 02, 2021
पिछले हफ्ते, इतिहास था बनाया था Dota 2 और AI के दायरे में। इंटरनेशनल में, डेंडी, खेल के सर्वश्रेष्ठ खिलाड़ियों में से एक को 1v1 में, एक बॉट द्वारा, लगातार दो बार बेरहमी से पीटा गया था। विचाराधीन बॉट द्वारा बनाया गया था ओपनएआई, एलोन मस्क का एक स्टार्टअप।
अब आपके कुछ प्रश्न हो सकते हैं। डोटा क्या है? ओपनएआई क्या है? और यह भी महत्वपूर्ण क्यों है? साथ शुरू करने के लिए, डोटा एक फ्री-टू-प्ले MOBA गेम है जिसमें आप नियंत्रण करते हैं नायकों और आपका उद्देश्य विरोधियों को नष्ट करना है प्राचीन. कई Dota प्रशंसक अंतिम वाक्य पर नाराज हो सकते हैं क्योंकि Dota के लिए बहुत कुछ है तो मैंने संक्षेप में बताया है।
खेल बहुत है जटिल इसके लिए एक बहुत ही कठिन सीखने की अवस्था के साथ। मैंने कुछ समय पहले डोटा सीखने के लिए एक मिशन शुरू किया था और मुझे एक बुनियादी अध्ययन करने में एक सप्ताह का समय लगा कैसे वीडियो, जहां वे खेल की रणनीति की व्याख्या करते हैं, हथियार, मंत्र, नायक क्या करते हैं और कैसे रेंगते हैं। और यह संपूर्ण बनाता है एआई बनाम डेंडी लड़ाई महत्वपूर्ण है क्योंकि यह दिखाता है कि एआई और एमएल कितने उन्नत हो गए हैं। तो आइए देखें कि उस बॉट में क्या शक्ति है और क्या हमें एआई विद्रोह से डरने की जरूरत है।
AI. के ग्रह का उदय
एआई का स्काईनेट बनना एक बहस का मुद्दा है। एलोन मस्क का मानना है कि कि यदि जांच में नहीं रखा गया है, तो स्काईनेट जैसा परिदृश्य होने की संभावना है। दूसरी ओर, मार्क जकरबर्गकहते हैं कि एआई हानिरहित है और प्रलय का दिन परिदृश्य का कारण नहीं बनेगा। Elon Musk ने इसी लक्ष्य के साथ OpenAI की शुरुआत की थी.
एआई के दुरुपयोग को रोकने के लिए और एआई में अनुसंधान जो हमारे खिलाफ नहीं होगा। और मैं उसकी तरफ हूँ।
लेकिन हम यहां चर्चा करने के लिए नहीं हैं। मुख्य विषय यह जानना है कि OpenAI द्वारा बनाए गए बॉट में क्या शक्ति है। इसे समझने के लिए मैंने इस विषय पर कुछ शोध पत्र और ब्लॉग पढ़े और अपने मित्र से भी संपर्क कियाअनमोल शर्मा जो एआई और एमएल शोधकर्ता हैं।
सुदृढीकरण सीखना
यह OpenAI के Dota बॉट के पीछे की तकनीक का नाम है। लेकिन इससे पहले कि हम इसमें तल्लीन हों, हमें यह समझने की जरूरत है कि एआई, या विशेष रूप से एआई में कितना सामान्य है वीडियो गेम काम। AI एक बहुत ही बोर्ड शब्द है और इसमें मशीन लर्निंग, डीप लर्निंग और न्यूरल नेटवर्क जैसे कई विषय शामिल हैं। एआई को गंभीर रूप से परिभाषित करने के लिए, हम कह सकते हैं कि यह कंप्यूटर की जानकारी से सीखने और उसके सीखने के आधार पर निर्णय लेने की क्षमता है। यह जितना अधिक सीखता है, निर्णय की शुद्धता उतनी ही बढ़ती जाती है।
यह सामान्य बॉट से कैसे भिन्न है?
सामान्य वीडियो गेम में बॉट ऐसा लग सकता है कि वे बुद्धिमान हैं लेकिन यह एआई का सही रूप नहीं है। खेलों में लगभग सभी बॉट सेट के आधार पर प्रोग्राम किए जाते हैं अगर.. इस.. फिर.. उस बयान। वे सिर्फ बयानों का पालन करते हैं और बयान में लिखी शर्तों के आधार पर कार्रवाई करते हैं।
ऊपर मैंने एक बहुत ही सरल उदाहरण दिखाया है। वास्तविक खेलों में कथन स्थितियों के भीतर स्थितियों के साथ बहुत अधिक जटिल होते हैं। ये कथन जितने अच्छी तरह से परिभाषित और विस्तृत होंगे, बॉट उतना ही बुद्धिमान प्रतीत होगा।
पुरस्कार और दंड
एआई लिंगो में, जिसे हम बॉट कहते हैं, एजेंट के रूप में जाना जाता है। लक्ष्य यह है कि एजेंट वह सीखे जो हम उससे सीखना चाहते हैं। एजेंट उसी तरीके से सीखता है जैसे आपका कुत्ता पुरस्कार और दंड के माध्यम से सीखता है। जब भी एजेंट कोई गलती करता है तो उसे दंडित किया जाता है और जब भी वह सही अनुमान लगाता है या सही उत्तर देता है, तो उसे पुरस्कृत किया जाता है। इस प्रणाली के माध्यम से, एजेंट उन कार्यों को जोड़ना सीखता है जो उसे दंड से बचने के लिए नहीं करना चाहिए और कार्रवाई (या इसी तरह की कार्रवाइयां) करते हैं जो पुरस्कार देते हैं।
यदि आप इसके बारे में बारीकी से सोचते हैं, तो यह कुछ शर्तों के आधार पर निर्णय लेने जैसा है, ठीक वैसे ही जैसे एल्गोरिदम इसे करते हैं। जैसा कि मैंने ऊपर दिखाया है, एक गेम बॉट, एक विस्फोटक बैरल पर आ रहा है, एल्गोरिथम के अनुसार कार्रवाई करेगा। एआई में एल्गोरिदम, जाहिर तौर पर इससे काफी जटिल हैं, जो पूरे सिस्टम को बनाता है बुद्धिमान.
हमारे OpenAI बॉट में आ रहा है, के अनुसार डेवलपर्स, इसने 2 सप्ताह के समय में पूरा खेल सीख लिया। 2 सप्ताह के पूरे समय के दौरान, यह 24×7 ऑनलाइन था और स्वयं की एक प्रति के विरुद्ध खेल रहा था। यह खेल की जटिलता और इस तथ्य को देखते हुए एक उल्लेखनीय मील का पत्थर है कि यह हरा सकता है डेंडी.
चालक रहित कारें अभी भी यहाँ क्यों नहीं हैं?
जब मैंने इस पूरी घटना के बारे में सुना तो मेरे दिमाग में यह पहला सवाल आया। यदि कोई बॉट इस तरह के खेल को सीख सकता है और शीर्ष खिलाड़ियों को हराने के लिए खुद को प्रशिक्षित कर सकता है, तो हम अभी भी पहिया क्यों चला रहे हैं। और यह वही सवाल था जो मैंने अपने दोस्त पर शूट किया था, श्री अनमोल शर्मा, जिन्होंने ड्राइवलेस कारों पर भी शोध किया है। उसे यही कहना था।
एक खेल में, जिसे मानव द्वारा विकसित किया जाता है, चरों की संख्या कम होती है। साथ ही, यदि एजेंट (बॉट) कोई गलती करता है, तो सबसे खराब दंड एक गोल नुकसान है। वास्तविक दुनिया में, एक गलती मौत है।
हालांकि डोटा एक जटिल खेल है, चाल, मंत्र और रणनीति के संभावित संयोजन, हालांकि अभी भी बेतुके रूप से बड़े हैं, अभी भी सीमित हैं। और गलतियों को बिना किसी वास्तविक दंड के अनुमति दी जाती है। लेकिन चालक रहित कार एजेंट के मामले में, गलतियों से खतरनाक दुर्घटनाएँ हो सकती हैं और मृत्यु भी हो सकती है।
वास्तविक दुनिया में, एजेंट को जिन चरों की निगरानी करनी होती है, वे अंतहीन होते हैं और इसके कारण उत्पन्न होने वाली स्थितियां होती हैं ये चर, जैसे एक और कार अचानक लेन बदल रही है, पैदल यात्री कार के सामने कूद रहे हैं, भी अंतहीन हैं। इसके अलावा, as जेरेमी क्लार्कसन सीधे शब्दों में कहें, तो उन्हें तत्काल दुर्घटना के कगार पर होने पर नैतिक और नैतिक निर्णय लेने होंगे (हालाँकि उनका सिद्धांत मान्य नहीं है)।
भविष्य
हम पहले से ही मानव नियंत्रित रोबोट के बारे में जानते हैं जो आंतरिक सर्जरी कर रहा है। अगली छलांग एआई-नियंत्रित रोबोट है जो इसे कर रही है। और यह सिर्फ चिकित्सा क्षेत्र में है। एआई निश्चित रूप से अगले दशक में कई क्षेत्रों में प्रमुख नई तकनीक होगी। लेकिन, एआई का दुरुपयोग नापाक उद्देश्यों के लिए भी किया जा सकता है जैसे कि डीडीओएस हमले, रैंसमवेयर बॉट और अन्य पीसी या निगमों के सिस्टम को हैक करना।
डोटा और अन्य खेलों के संबंध में, हम अन्य खेलों के लिए भी ऐसे बुद्धिमान बॉट देखने की उम्मीद कर सकते हैं, जिनके खिलाफ खिलाड़ी और भी बेहतर प्रदर्शन करने के लिए प्रशिक्षित कर सकते हैं। और क्या मैंने उल्लेख किया है कि OpenAI अगले साल के अंतर्राष्ट्रीय में 5v5 करेगा? इसलिए मैं कम से कम इन-बिल्ट डम्बर बॉट्स को हराने के लिए अपने Dota कौशल को बढ़ाने के लिए तैयार हूं। दैवीय छोटी तलवार यहाँ मैं आता हूं!