Meta เปิดตัวโมเดล Speech AI เพื่อระบุภาษาพูดมากกว่า 4,000 ภาษา – TechCult
เบ็ดเตล็ด / / May 23, 2023
ในการประกาศที่ก้าวล้ำ เมตายักษ์ใหญ่ด้านเทคโนโลยีที่อยู่เบื้องหลังแพลตฟอร์มและเทคโนโลยีที่เป็นนวัตกรรมใหม่ ได้เปิดตัวชุดของสิ่งประดิษฐ์ โมเดลอัจฉริยะ (AI) ที่มีศักยภาพในการปฏิวัติความสามารถในการเข้าถึงภาษาและ การเก็บรักษา ตระหนักถึงการหายไปของหลายภาษาที่ใกล้เข้ามาและข้อจำกัดของเทคโนโลยีการรู้จำเสียงและการสร้างที่มีอยู่ ใหม่ของ Meta โมเดล AI คำพูดหลายภาษาจำนวนมาก (MMS) มีจุดมุ่งหมายเพื่อเชื่อมอุปสรรคทางภาษาและช่วยให้บุคคลสามารถเข้าถึงข้อมูลและโต้ตอบกับอุปกรณ์ในภาษาที่พวกเขาต้องการ
สารบัญ
ระบุภาษาพูดมากกว่า 4,000 ภาษา
ด้วยเทคโนโลยีเสียงพูดในปัจจุบันที่ครอบคลุมกว่า 100 ภาษา โมเดล MMS ของ Meta ได้ขยายขอบเขตนี้ออกไปอย่างน่าอัศจรรย์ 1,100 ภาษา- เพิ่มขึ้นเป็นสิบเท่า นอกจากนี้ โมเดล AI ขั้นสูงเหล่านี้ยังมี ความสามารถในการระบุภาษาพูดมากกว่า 4,000 ภาษาการปรับปรุงที่น่าทึ่งถึงสี่สิบเท่า ความหมายสำหรับการสื่อสารข้ามวัฒนธรรมและความไม่ครอบคลุมทางภาษาเป็นสิ่งที่ลึกซึ้ง
การโต้ตอบที่ราบรื่นในภาษาที่ต้องการ
ตั้งแต่ประสบการณ์เสมือนจริงและความจริงเสริมไปจนถึงบริการส่งข้อความ โมเดล AI เหล่านี้สามารถเข้าใจและตีความเสียงในภาษาที่ผู้คนต้องการ ทำให้สามารถโต้ตอบได้อย่างราบรื่นโดยไม่คำนึงถึงความหลากหลายทางภาษา. วิสัยทัศน์คือการส่งเสริมโลกที่ ภาษาไม่ใช่อุปสรรคอีกต่อไปและที่ซึ่งทุกคนสามารถสื่อสารกับเทคโนโลยีในภาษาที่พวกเขารู้สึกสบายที่สุด
นวัตกรรมการใช้ข้อความทางศาสนา
หนึ่งในความท้าทายหลักที่ Meta เผชิญในการพัฒนาโมเดลเหล่านี้คือการขาดแคลนข้อมูลเสียงในภาษาต่างๆ นับพันภาษา ชุดข้อมูลเสียงพูดแบบดั้งเดิมครอบคลุมสูงสุด 100 ภาษา ในจังหวะแห่งความเฉลียวฉลาด Meta หันไปหาข้อความทางศาสนาเช่นพระคัมภีร์ซึ่งได้รับการแปลและศึกษาอย่างกว้างขวาง
การอ่านพันธสัญญาใหม่ใน 1,100 ภาษา
Meta รวบรวมชุดข้อมูลที่มีการอ่านพันธสัญญาใหม่ในภาษาต่างๆ กว่า 1,100 ภาษา โดยใช้ประโยชน์จากการบันทึกเสียงที่เผยแพร่ต่อสาธารณะ ให้ข้อมูลเฉลี่ย 32 ชั่วโมงต่อภาษา
ความครอบคลุมของภาษาขยายไปถึง 4,000 ภาษา
เพื่อขยายความครอบคลุมของภาษาให้ดียิ่งขึ้น Meta ได้รวมการบันทึกการอ่านทางศาสนาคริสต์ต่างๆ ที่ไม่มีป้ายกำกับ ทำให้จำนวนภาษาที่มีอยู่เพิ่มขึ้นเป็นมากกว่า 4,000 ภาษา แม้ว่า ข้อมูลส่วนใหญ่ประกอบด้วยผู้พูดที่เป็นผู้ชาย และเนื้อหาทางศาสนา การวิเคราะห์ของ Meta ทำให้มั่นใจได้ว่า นางแบบทำงานได้ดีพอ ๆ กันทั้งเสียงชายและหญิง. นอกจากนี้ แบบจำลองไม่ได้แสดงอคติต่อการสร้างภาษาทางศาสนามากขึ้น คลายความกังวลเกี่ยวกับการบิดเบือนที่อาจเกิดขึ้นในผลลัพธ์
โมเดล Meta Open-Source และรหัสสำหรับการรักษาภาษา
ที่สำคัญ Meta ได้เลือกที่จะ โอเพ่นซอร์สทั้งโมเดลและโค้ดทำให้นักวิจัยคนอื่นสามารถ สร้างจากผลงานของพวกเขาและมีส่วนร่วมในการอนุรักษ์และการเข้าถึงภาษาทั่วโลก. วิธีการทำงานร่วมกันนี้เน้นย้ำถึงความมุ่งมั่นของ Meta ในการรวมความพยายามเป็นหนึ่งเดียวในการอนุรักษ์ภาษาและทำให้โลกใกล้ชิดกันมากขึ้น
นอกจากนี้ การเปิดตัวโมเดล AI คำพูดหลายภาษาจำนวนมากของ Meta ยังสอดคล้องอย่างลงตัวกับการเปิดตัวโครงการล่าสุดของพวกเขา— การพัฒนาชิปซิลิกอนแบบกำหนดเองตัวแรกที่สร้างขึ้นสำหรับโมเดล AI โดยเฉพาะ. ความก้าวหน้าครั้งสำคัญนี้เป็นส่วนสำคัญของกลยุทธ์ที่ครอบคลุมของ Meta เพื่อปฏิวัติโครงสร้างพื้นฐาน AI เร่งการวิจัย AI และกำหนดรูปแบบ metaverse ที่เกิดขึ้นใหม่
ด้วยการปรับแต่งและขยายขีดความสามารถของโมเดล AI ทำให้ Meta มีเป้าหมายที่จะทลายกำแพงภาษาและส่งเสริมชุมชนทั่วโลกที่เติบโตบนความหลากหลายทางภาษา
แหล่งที่มา: ห้องข่าว Meta
อเล็กซ์ เครก
Alex ขับเคลื่อนด้วยความหลงใหลในเทคโนโลยีและเนื้อหาเกม ไม่ว่าจะเป็นการเล่นวิดีโอเกมล่าสุด การติดตามข่าวสารเทคโนโลยีล่าสุด หรือการมีส่วนร่วม กับบุคคลอื่นๆ ที่มีแนวคิดเดียวกันทางออนไลน์ ความรักในเทคโนโลยีและการเล่นเกมของอเล็กซ์นั้นปรากฏชัดในทุกสิ่งที่เขามี ทำ.
Alex ขับเคลื่อนด้วยความหลงใหลในเทคโนโลยีและเนื้อหาเกม ไม่ว่าจะเป็นการเล่นวิดีโอเกมล่าสุด การติดตามข่าวสารเทคโนโลยีล่าสุด หรือการมีส่วนร่วม กับบุคคลอื่นๆ ที่มีแนวคิดเดียวกันทางออนไลน์ ความรักในเทคโนโลยีและการเล่นเกมของอเล็กซ์นั้นปรากฏชัดในทุกสิ่งที่เขามี ทำ.