تقدم Meta نماذج Speech AI لتحديد أكثر من 4000 لغة منطوقة - TechCult
منوعات / / May 23, 2023
في إعلان رائد ، ميتا، عملاق التكنولوجيا وراء المنصات والتقنيات المبتكرة ، كشف النقاب عن سلسلة مصطنعة نماذج الذكاء (AI) التي لديها القدرة على إحداث ثورة في إمكانية الوصول إلى اللغة و الحفظ. إدراك الاختفاء الوشيك للعديد من اللغات والقيود المفروضة على تقنية التعرف على الكلام وتوليدها ، تعد Meta الجديدة نماذج الذكاء الاصطناعي للخطاب متعدد اللغات (MMS) تهدف إلى سد الحواجز اللغوية وتمكين الأفراد من الوصول إلى المعلومات والتفاعل مع الأجهزة بلغاتهم المفضلة.
جدول المحتويات
تحديد أكثر من 4000 لغة منطوقة
مع تقنية الكلام الحالية التي تغطي حوالي 100 لغة ، وسعت نماذج MMS من Meta هذا النطاق إلى مستوى مذهل 1100 لغة—زيادة عشرة أضعاف. علاوة على ذلك ، تمتلك نماذج الذكاء الاصطناعي المتقدمة هذه الامتداد القدرة على تحديد أكثر من 4000 لغة منطوقة، وهو تحسن لا يصدق أربعين ضعفًا. الآثار المترتبة على التواصل بين الثقافات والشمولية اللغوية عميقة.
تفاعل سلس في اللغة المفضلة
من تجارب الواقع الافتراضي والمعزز إلى خدمات المراسلة ، يمكن لنماذج الذكاء الاصطناعي هذه الآن فهم الأصوات وتفسيرها باللغات المفضلة للأشخاص ، تمكين التفاعل السلس بغض النظر عن التنوع اللغوي. الرؤية هي تعزيز عالم حيث اللغة لم تعد عائقا، وحيث يمكن للجميع التواصل مع التكنولوجيا بلغة تشعرهم براحة أكبر.
الاستخدام المبتكر للنصوص الدينية
كان أحد التحديات الرئيسية التي واجهتها Meta في تطوير هذه النماذج ندرة البيانات الصوتية لآلاف اللغات. غطت مجموعات بيانات الكلام التقليدية 100 لغة كحد أقصى. ببراعة ، تحولت ميتا إلى النصوص الدينية ، مثل الكتاب المقدس ، التي تمت ترجمتها ودراستها على نطاق واسع.
قراءات العهد الجديد في 1100 لغة
بالاستفادة من التسجيلات الصوتية المتاحة للجمهور لهذه الترجمات ، قامت Meta بتجميع مجموعة بيانات تضم قراءات من العهد الجديد بأكثر من 1100 لغة ، توفير ما متوسطه 32 ساعة من البيانات لكل لغة.
تمتد التغطية اللغوية إلى 4000 لغة
لتوسيع تغطية اللغة بشكل أكبر ، أدرجت Meta تسجيلات غير مسماة لقراءات دينية مسيحية مختلفة ، مما دفع عدد اللغات المتاحة إلى أكثر من 4000 لغة. على الرغم من أن تتكون البيانات بشكل أساسي من المتحدثين الذكور والمحتوى الديني ، يؤكد تحليل Meta أن تؤدي العارضات أداءً جيدًا على حد سواء لأصوات الذكور والإناث. بالإضافة إلى ذلك ، لم تظهر النماذج أي تحيز تجاه إنتاج المزيد من اللغة الدينية ، مما أدى إلى تهدئة المخاوف بشأن أي انحراف محتمل في المخرجات.
نماذج وشفرات Meta Open-Sources للحفاظ على اللغة
بشكل حاسم ، اختارت Meta أن مفتوحة المصدر لكلٍّ من نماذجها ورموزها، مما يمكّن الباحثين الآخرين من ذلك البناء على عملهم والمساهمة في الحفاظ على اللغات وإمكانية الوصول إليها في جميع أنحاء العالم. يؤكد هذا النهج التعاوني على التزام Meta بتوحيد الجهود في الحفاظ على اللغة وتقريب العالم معًا.
علاوة على ذلك ، فإن تقديم Meta لنموذج الذكاء الاصطناعي للكلام متعدد اللغات يتماشى بسلاسة مع كشف النقاب عن مشروع مؤخرًا - تطوير أول شريحة سيليكون مخصصة تم تصميمها حصريًا لنماذج الذكاء الاصطناعي. يعد هذا التقدم الهائل جزءًا لا يتجزأ من استراتيجية Meta الشاملة لإحداث ثورة في البنية التحتية للذكاء الاصطناعي ، وتسريع أبحاث الذكاء الاصطناعي ، وتشكيل المعادلة الناشئة.
من خلال تحسين وتوسيع قدرات نماذج الذكاء الاصطناعي الخاصة بها ، تهدف Meta إلى كسر حواجز اللغة وتعزيز مجتمع عالمي يزدهر على التنوع اللغوي.
مصدر: غرفة الأخبار ميتا
أليكس كريج
أليكس مدفوع بشغف بالتكنولوجيا ومحتوى الألعاب. سواء كان ذلك من خلال لعب أحدث ألعاب الفيديو أو مواكبة آخر أخبار التكنولوجيا أو المشاركة مع الأفراد الآخرين المتشابهين في التفكير عبر الإنترنت ، فإن حب Alex للتكنولوجيا والألعاب واضح في كل ذلك يفعل.
أليكس مدفوع بشغف بالتكنولوجيا ومحتوى الألعاب. سواء كان ذلك من خلال لعب أحدث ألعاب الفيديو أو مواكبة آخر أخبار التكنولوجيا أو المشاركة مع الأفراد الآخرين المتشابهين في التفكير عبر الإنترنت ، فإن حب Alex للتكنولوجيا والألعاب واضح في كل ذلك يفعل.