Meta приєднується до гонки AI. Випускає нову мовну модель LLaMA
Різне / / April 02, 2023
2023 рік став роком безпрецедентного розвитку у сфері штучного інтелекту. Після випуску ChatGPT та його інтеграції з Microsoft Teams і Bing, середовище на арені ШІ нагрівається. Щоб протистояти цій односторонній схильності, Google створив власну модель штучного інтелекту Bard, яка призвела до приблизно 12000 звільнень. Тепер третій претендент Meta приєднується до гонки ШІ та випускає нову мовну модель LLaMA.
LlaMA або Велика мовна модель Meta AI, це велика мовна модель, яка, як кажуть, допоможе дослідникам просувати роботу в інших вертикалях ШІ. Це не просто одна сутність, а різні підверсії, які набагато менші за розміром. Підводячи підсумок, це так «набір моделей базової мови з параметрами від 7B до 65B».
- Ідея LLaMA полягає в тому, що менші мовні моделі значно збільшать швидкість дослідження ШІ, оскільки велика спільнота не має доступу до інфраструктури, необхідної для вивчення цих моделей.
- Цей запуск насправді не демонструє наміру конкурувати з іншими моделями ШІ, такими як ChatGPT або Bard, які мають здатність спілкуватися.
Meta також надав пояснення в зрозумілій формі чому вони вибрали менші моделі. Це тому, що їх легко перенавчати, оскільки вони навчаються на фрагментах слів або жетонах. Він також передбачив, що його підмоделі LLaMA 65B і LLaMA 33B навчені на 1,4 трильйона токенів, а найменша модель LLaMA 7B – на один трильйон токенів.
Необхідно прочитати:YouChat 2.0 може конкурувати з Google Bard і ChatGPT
Хоча зараз він не буде комерційно доступним з причин, зазначених у блог. «Щоб зберегти цілісність і запобігти неправильному використанню, ми випускаємо нашу модель за некомерційною ліцензією, зосередженою на дослідницьких випадках використання. Доступ до моделі надаватиметься на індивідуальній основі академічним дослідникам; ті, хто пов’язаний з організаціями в уряді, громадянському суспільстві та наукових колах; та промислові дослідницькі лабораторії по всьому світу».
в Мета дослідницька стаття, в анотації зазначено, що,«Зокрема, LLaMA-13B перевершує GPT-3 (175B) за більшістю тестів, а LLaMA-65B конкурує з найкращими моделями Chinchilla70B і PaLM-540B». Ці найкращі моделі належать DeepMind і Google відповідно. Крім того, було виявлено, що компанія використовує лише загальнодоступні дані, що робить модель сумісною з відкритим кодом. Це на відміну від моделей AI, таких як DeepMind Chinchilla, Google PaLM або OpenAI GPT-3, які використовують незадокументовані або загальнодоступні дані.
Рекомендовано:Як інтегрувати ChatGPT у Microsoft Word
Після того, як meta приєднується до змагань зі штучним інтелектом і випускає нову мовну модель LLaMA, випуск Google Bard викликав невеликий шум. Це не є чимось поганим, оскільки це не поспішає з випуском, що призвело до Google Bard дає неправильну відповідь і багато критики. Це щось схоже на Bing Chatbot, який відкрив занадто багато про його систему, як її справжня назва Сідней. Це також призвело до Microsoft обмежує чат Bing AI до 5 відповідей.
Оголошення про LLaMA також було досить однозначним із лише публікацією у Facebook та повідомленням в Instagram від Meta Channel. У ньому зазначено«Сьогодні ми збираємося випустити нову сучасну велику мовну модель штучного інтелекту під назвою LLaMA, розроблену для того, щоб допомогти дослідникам просувати свою роботу. LLM показали багато перспектив у створенні тексту, веденні бесід, узагальненні письмового матеріалу та більш складних завданнях, таких як розв’язування математичних теорем або прогнозування структур білка. Meta прагне до цієї відкритої моделі дослідження, і ми зробимо нашу нову модель доступною для спільноти дослідників ШІ». Meta також в захваті від того, як спільнота навчатиметься та створюватиме за допомогою LLaMA.
Слідкуйте за новинами про технології та останні інновації в області ШІ на TechCult!
Джерело:Блог Meta AI