ما الذي يميز روبوت OpenAI الذي يتغلب على Dendi
منوعات / / December 02, 2021
الأسبوع الماضي ، كان التاريخ خلقت في عالم Dota 2 و AI. في الدولية ، دندي، أحد أفضل اللاعبين في اللعبة ، تعرض للضرب بلا رحمة في 1v1 ، بواسطة روبوت ، مرتين على التوالي. تم صنع الروبوت المعني بواسطة أوبن إيه آي، وهي شركة ناشئة من Elon Musk.
الآن قد يكون لديك بعض الأسئلة. ما هو Dota؟ ما هو OpenAI؟ ولماذا هذا مهم حتى؟ لتبدأ، دوتا هي لعبة MOBA مجانية يمكنك التحكم فيها أبطال وهدفك تدمير الخصوم عتيق. قد ينتقد العديد من معجبي Dota الجملة الأخيرة لأن هناك الكثير من Dota ثم لخصتها.
اللعبة جدا مركب مع منحنى تعليمي حاد للغاية. كنت قد شرعت في مهمة لتعلم Dota منذ بعض الوقت واستغرق الأمر أسبوعًا لمجرد متابعة أحد الأساسيات كيف فيديو ، حيث يشرحون استراتيجية اللعبة ، وما هي الأسلحة والتعاويذ والأبطال وكيفية تزحف الألغام. وهذا يجعل الكل منظمة العفو الدولية مقابل دندي المعركة مهمة لأنها توضح مدى تقدم الذكاء الاصطناعي والتعلم الآلي. لذلك دعونا نرى ما الذي يدعم هذا الروبوت وهل نحتاج إلى الخوف من انتفاضة الذكاء الاصطناعي.
صعود كوكب الذكاء الاصطناعي
أصبح الذكاء الاصطناعي في Skynet مشكلة قابلة للنقاش. إيلون ماسك يعتقد
أنه إذا لم يتم التحقق منه ، أ سكاي نت مثل السيناريو من المرجح أن يحدث. من ناحية أخرى، مارك زوكربيرجيقول أن الذكاء الاصطناعي غير ضار ولن يتسبب في حدوث سيناريو يوم القيامة. بدأ إيلون ماسك OpenAI بهذا الهدف.لمنع إساءة استخدام الذكاء الاصطناعي والبحث في الذكاء الاصطناعي الذي لن ينقلب علينا. وأنا إلى جانبه.
لكن هذا ليس ما نحن هنا لنناقشه. الموضوع الرئيسي هو معرفة ما يدعم الروبوت الذي تصنعه شركة OpenAI. لفهم ذلك ، قرأت بعض الأوراق البحثية والمدونات حول هذا الموضوع واتصلت أيضًا بصديقيأنمول شارما من هو باحث في الذكاء الاصطناعي والتعلم الآلي.
تعزيز التعلم
هذا هو اسم التقنية الكامنة وراء روبوت Dota الخاص بـ OpenAI. ولكن قبل الخوض في الأمر ، نحتاج إلى فهم مدى عمومية الذكاء الاصطناعي ، أو الذكاء الاصطناعي تحديدًا العاب الكترونية الشغل. الذكاء الاصطناعي هو مصطلح خاص باللوحة ويحتوي على العديد من الموضوعات مثل التعلم الآلي والتعلم العميق والشبكات العصبية على سبيل المثال لا الحصر. لتعريف الذكاء الاصطناعي بشكل فج ، يمكننا القول إنها قدرة الكمبيوتر على التعلم من المعلومات واتخاذ القرارات بناءً على التعلم. كلما تعلمت أكثر ، زادت صحة القرار.
كيف تختلف عن الروبوتات العادية؟
قد تبدو الروبوتات في ألعاب الفيديو عمومًا ذكية ولكنها ليست شكلاً حقيقيًا من أشكال الذكاء الاصطناعي. تتم برمجة جميع هذه الروبوتات تقريبًا في الألعاب بناءً على المجموعة لو.. هذه.. ثم.. الذي - التي صياغات. إنهم فقط يتبعون البيانات ويتخذون الإجراءات بناءً على الشروط المكتوبة في البيان.
أعلاه لقد أظهرت مثالًا بسيطًا جدًا. البيانات في الألعاب الحقيقية أكثر تعقيدًا بكثير مع وجود ظروف ضمن الظروف. كلما كانت هذه العبارات محددة ومفصلة بشكل جيد ، كلما بدا الروبوت أكثر ذكاءً.
المكافآت والعقوبات
في لغة الذكاء الاصطناعي ، يُعرف ما نسميه الروبوت بالوكيل. الهدف هو جعل الوكيل يتعلم كل ما نريده أن يتعلمه. يتعلم الوكيل بنفس الطريقة التي يتعلم بها كلبك ، من خلال المكافآت والعقوبات. كلما أخطأ الوكيل يعاقب ، وكلما قدم التخمين الصحيح أو أعطى إجابة صحيحة ، يكافأ. من خلال هذا النظام ، يتعلم الوكيل ربط الإجراءات التي يجب ألا يقوم بها لتجنب العقوبة وتنفيذ الإجراء (أو الإجراءات المماثلة) التي تمنح المكافآت.
إذا فكرت في الأمر عن كثب ، فإن الأمر يشبه تمامًا اتخاذ قرارات بناءً على ظروف معينة ، تمامًا كما تفعل الخوارزميات. كما أوضحت أعلاه ، فإن روبوت اللعبة ، عند وصوله إلى برميل متفجر ، سيتخذ الإجراءات وفقًا للخوارزمية. من الواضح أن الخوارزميات في الذكاء الاصطناعي معقدة للغاية من هذا ، مما يجعل النظام بأكمله ذكي.
القدوم إلى روبوت OpenAI الخاص بنا ، وفقًا لـ المطورين، تعلمت اللعبة بأكملها في غضون أسبوعين. طوال فترة أسبوعين كاملة ، كانت متصلة بالإنترنت على مدار الساعة طوال أيام الأسبوع وتلعب ضد نسخة من نفسها. يعد هذا إنجازًا رائعًا بالنظر إلى مدى تعقيد اللعبة وحقيقة قدرتها على التغلب عليها دندي.
لماذا لا تزال السيارات الخالية من السائقين غير موجودة؟
كان هذا أول سؤال خطر ببالي عندما سمعت عن هذا الحدث برمته. إذا تمكن الروبوت من تعلم مثل هذه اللعبة وتدريب نفسه إلى درجة التغلب على أفضل اللاعبين ، فلماذا ما زلنا ندير عجلة القيادة. وكان هذا هو نفس السؤال الذي وجهته إلى صديقي ، السيد Anmol Sharma، الذي أجرى أيضًا بحثًا عن السيارات بدون قيادة. هذا ما كان عليه أن يقول.
في لعبة طورها الإنسان ، يكون عدد المتغيرات أقل. بالإضافة إلى ذلك ، إذا أخطأ الوكيل (الروبوت) ، فإن أسوأ عقوبة هي الخسارة الكاملة. في العالم الحقيقي ، خطأ واحد هو الموت.
على الرغم من أن Dota هي لعبة معقدة ، إلا أن المجموعات الممكنة من الحركات والتعاويذ والتكتيكات ، على الرغم من أنها لا تزال كبيرة بشكل سخيف ، لا تزال محدودة. والأخطاء مسموح بها بدون عقوبة حقيقية. ولكن في حالة وجود وكيل سيارات بدون سائق ، يمكن أن تؤدي الأخطاء إلى حوادث خطيرة وحتى الموت.
في العالم الحقيقي ، عدد المتغيرات التي يجب على الوكيل مراقبتها لا حصر له والحالات التي تنشأ بسببها هذه المتغيرات ، مثل سيارة أخرى تغير مسارها فجأة ، قفز المشاة أمام السيارة ، هي أيضًا لا حصر لها. بالإضافة إلى ذلك جيريمي كلاركسون بعبارة أخرى ، سيتعين عليهم اتخاذ قرارات أخلاقية ومعنوية عندما يكونون على وشك التعرض لحادث مباشر (على الرغم من أن نظريته غير صحيحة).
المستقبل
نحن نعلم بالفعل أن الروبوت الذي يتحكم فيه الإنسان يجري عمليات جراحية جوهرية. القفزة التالية هي قيام الروبوتات التي يتحكم فيها الذكاء الاصطناعي بتنفيذها. وهذا فقط في المجال الطبي. من المؤكد أن الذكاء الاصطناعي سيكون التكنولوجيا الجديدة المهيمنة في العقد القادم في العديد من المجالات. ولكن ، يمكن أيضًا إساءة استخدام الذكاء الاصطناعي لأغراض شائنة مثل DDoS الهجمات برامج الفدية الروبوتات واختراق أجهزة الكمبيوتر أو أنظمة الشركات الأخرى.
فيما يتعلق بـ Dota والألعاب الأخرى ، يمكننا أن نتوقع أن نرى مثل هذه الروبوتات الذكية تُصنع لألعاب أخرى أيضًا ، والتي يمكن للاعبين التدرب ضدها لأداء أفضل. وهل ذكرت أن أوبن إيه آي ستعمل 5 ضد 5 في بطولة العام المقبل الدولية؟ لذلك أنا بصدد صقل مهارات Dota الخاصة بي لهزيمة الروبوتات الغبية المضمنة على الأقل. سيف الإلهي ها أنا آتية!