Meta เข้าร่วม AI Race เปิดตัวโมเดลภาษาใหม่ LLaMA
เบ็ดเตล็ด / / April 02, 2023
ปี 2023 เป็นปีแห่งการพัฒนาที่ไม่เคยเกิดขึ้นมาก่อนในด้านปัญญาประดิษฐ์ หลังจากการเปิดตัว ChatGPT และการผสานรวมกับ ทีม Microsoft และ Bing สภาพแวดล้อมในเวที AI กำลังร้อนระอุ เพื่อตอบโต้ความโน้มเอียงด้านเดียวนี้ Google จึงสร้าง Bard โมเดล AI ของตัวเองขึ้นมา ปลดพนักงาน 12,000 คน. ตอนนี้ Meta คู่แข่งคนที่สามเข้าร่วมการแข่งขัน AI และเปิดตัวโมเดลภาษาใหม่ LLaMA
LLaMA หรือ Meta AI โมเดลภาษาขนาดใหญ่เป็นโมเดลภาษาขนาดใหญ่ที่กล่าวกันว่าช่วยนักวิจัยในการพัฒนางานในแนวดิ่งอื่นๆ ของ AI ไม่ใช่แค่เอนทิตีเดียว แต่มีรุ่นย่อยต่างๆ ที่มีขนาดเล็กกว่ามาก สรุปก็คือ “คอลเลกชันของโมเดลภาษาพื้นฐานตั้งแต่พารามิเตอร์ 7B ถึง 65B”
- แนวคิดเบื้องหลัง LLaMA คือโมเดลภาษาที่เล็กลงจะขยายความเร็วของการวิจัยใน AI อย่างมหาศาล เนื่องจากชุมชนขนาดใหญ่ไม่สามารถเข้าถึงโครงสร้างพื้นฐานที่จำเป็นสำหรับการศึกษาโมเดลเหล่านี้
- การเปิดตัวครั้งนี้ไม่ได้แสดงถึงความตั้งใจจริงที่จะแข่งขันกับ AI รุ่นอื่นๆ เช่น ChatGPT หรือ Bard ที่มีความสามารถในการสื่อสาร
Meta ยังให้คำอธิบายในรูปแบบที่ชัดเจน ทำไมพวกเขาถึงเลือกรุ่นเล็ก เป็นเพราะพวกเขาฝึกใหม่ได้ง่ายเนื่องจากได้รับการฝึกฝนจากคำหรือโทเค็น นอกจากนี้ยังระบุว่ารุ่นย่อย LLaMA 65B และ LLaMA 33B ได้รับการฝึกอบรมบนโทเค็น 1.4 ล้านล้านโทเค็น ในขณะที่ LLaMA 7B รุ่นที่เล็กที่สุดนั้นใช้โทเค็นหนึ่งล้านล้านโทเค็น
ต้องอ่าน:YouChat 2.0 สามารถแข่งขันกับ Google Bard และ ChatGPT ได้
แม้ว่าจะไม่สามารถใช้ได้ในเชิงพาณิชย์ในขณะนี้ด้วยเหตุผลที่ระบุไว้ใน บล็อก. “เพื่อรักษาความสมบูรณ์และป้องกันการใช้งานในทางที่ผิด เราจึงเผยแพร่โมเดลของเราภายใต้ใบอนุญาตที่ไม่ใช่เชิงพาณิชย์ซึ่งมุ่งเน้นไปที่กรณีการใช้งานการวิจัย การเข้าถึงแบบจำลองจะได้รับเป็นกรณีไปสำหรับนักวิจัยทางวิชาการ ผู้ที่สังกัดองค์กรภาครัฐ ภาคประชาสังคม และภาควิชาการ และห้องปฏิบัติการวิจัยอุตสาหกรรมทั่วโลก”
ใน เอกสารการวิจัยเมตาบทคัดย่อระบุว่า” โดยเฉพาะอย่างยิ่ง LLaMA-13B มีประสิทธิภาพเหนือกว่า GPT-3 (175B) ในเกณฑ์มาตรฐานส่วนใหญ่ และ LLaMA-65B สามารถแข่งขันกับรุ่นที่ดีที่สุดอย่าง Chinchilla70B และ PaLM-540B ได้” โมเดลที่ดีที่สุดเหล่านี้เป็นของ DeepMind และ Google ตามลำดับ นอกจากนี้ยังเปิดเผยว่าบริษัทใช้ประโยชน์จากข้อมูลที่เปิดเผยต่อสาธารณะเท่านั้น ซึ่งทำให้โมเดลนี้เข้ากันได้กับโอเพ่นซอร์ส ซึ่งแตกต่างจากโมเดล AI เช่น DeepMind Chinchilla, Google PaLM หรือ OpenAI GPT-3 ซึ่งใช้ข้อมูลที่ไม่มีเอกสารหรือข้อมูลที่ไม่เปิดเผยต่อสาธารณะ
ที่แนะนำ:วิธีรวม ChatGPT เข้ากับ Microsoft Word
หลังจากเมตาเข้าร่วมการแข่งขัน AI และเผยแพร่ภาษาใหม่ Model LLaMA ก็ไม่เห็นด้วยกับการปล่อย Google Bard ด้วยกระแสฮือฮาเล็กน้อย นี่ไม่ใช่สิ่งที่ไม่ดีเนื่องจากมันไม่ได้เร่งรีบการเปิดตัวที่ส่งผลให้ Google Bard ตอบผิด และวิจารณ์กันมากมาย นี่คือสิ่งที่คล้ายกับ Bing Chatbot ที่เปิดเผยมากเกินไป เกี่ยวกับระบบของมัน เช่น ชื่อจริงของมันคือซิดนีย์ นอกจากนี้ยังส่งผลให้ Microsoft จำกัด การแชท Bing AI ไว้ที่ 5 การตอบกลับ.
การประกาศของ LLaMA ยังเป็นหนึ่งเดียวกับโพสต์บน Facebook และข้อความบน Instagram จาก Meta Channel โดยระบุว่า,” วันนี้เราจะเปิดตัวโมเดลภาษาขนาดใหญ่ของ AI ที่ล้ำสมัยที่เรียกว่า LLaMA ที่ออกแบบมาเพื่อช่วยให้นักวิจัยพัฒนางานของพวกเขา LLM ได้แสดงให้เห็นคำมั่นสัญญามากมายในการสร้างข้อความ การสนทนา การสรุปเนื้อหาที่เป็นลายลักษณ์อักษร และงานที่ซับซ้อนมากขึ้น เช่น การแก้ทฤษฎีบททางคณิตศาสตร์หรือการทำนายโครงสร้างโปรตีน Meta มุ่งมั่นต่อรูปแบบการวิจัยแบบเปิดนี้ และเราจะทำให้รูปแบบใหม่ของเราพร้อมใช้งานสำหรับชุมชนการวิจัย AI” Meta ยังรู้สึกตื่นเต้นเกี่ยวกับวิธีการที่ชุมชนจะเรียนรู้และสร้างโดยใช้ LLaMA
คอยติดตามการอัปเดตเพิ่มเติมเกี่ยวกับเทคโนโลยีและนวัตกรรมล่าสุดใน AI บน TechCult!
แหล่งที่มา:บล็อก Meta AI