Мета се придружује АИ Раце-у издаје нови језички модел ЛЛаМА
Мисцелланеа / / April 02, 2023
2023. година је била година развоја без преседана у области вештачке интелигенције. Након објављивања ЦхатГПТ-а и његове интеграције са Мицрософт Теамс и Бинг, окружење у АИ арени се загрева. Да би се супротставио овој једностраној склоности Гугл је смислио сопствени АИ модел Бард који је резултирао око 12000 отпуштања. Сада се трећи кандидат Мета придружује трци АИ и издаје нови језички модел ЛЛаМА.
ЛЛаМА или Велики језички модел Мета АИ, је велики језички модел за који се каже да помаже истраживачима да унапреде рад у другим вертикалама АИ. То није само један ентитет, већ са различитим подверзијама које су много мање величине. Да сумирамо, јесте „колекција модела основног језика у распону од 7Б до 65Б параметара.“
- Идеја која стоји иза ЛЛаМА је да ће мањи језички модели у великој мери повећати брзину истраживања у АИ јер велика заједница нема приступ инфраструктури потребној за проучавање ових модела.
- Ово лансирање заправо не показује своју намеру да се такмичи са другим АИ моделима као што су ЦхатГПТ или Бард који имају способност комуникације.
Мета је такође дао објашњење у луцидном облику зашто су изабрали мање моделе. То је зато што их је лако поново обучити јер су обучени на деловима речи или лексема. Такође је обезбедио да су његови подмодели ЛЛаМА 65Б и ЛЛаМА 33Б обучени на 1,4 трилиона токена, док је најмањи модел ЛЛаМА 7Б на један трилион токена.
Мораш прочитати:ИоуЦхат 2.0 би могао да буде ривал Гоогле Барду и ЦхатГПТ-у
Иако тренутно неће бити комерцијално доступан из разлога наведених у блог. „Да бисмо одржали интегритет и спречили злоупотребу, објављујемо наш модел под некомерцијалном лиценцом фокусираном на случајеве употребе у истраживању. Приступ моделу ће бити одобрен од случаја до случаја академским истраживачима; они који су повезани са организацијама у влади, цивилном друштву и академским круговима; и лабораторије за истраживање индустрије широм света.”
У Мета Ресеарцх папер, у сажетку је наведено да,„Нарочито, ЛЛаМА-13Б надмашује ГПТ-3 (175Б) на већини мерила, а ЛЛаМА-65Б је конкурентан најбољим моделима Цхинцхилла70Б и ПаЛМ-540Б.“ Ови најбољи модели припадају ДеепМинд-у и Гоогле-у. Такође, откривено је да компанија користи само јавно доступне податке што модел чини компатибилним са отвореним извором. Ово је за разлику од АИ модела као што су ДеепМинд Цхинцхилла, Гоогле ПаЛМ или ОпенАИ ГПТ-3 који користе недокументоване или јавно недоступне податке.
Препоручено:Како интегрисати ЦхатГПТ у Мицрософт Ворд
Након што се мета придружи АИ трци и издаје нови језик, Модел ЛЛаМА, био је у сукобу са издањем Гоогле Бард-а уз мало буке. Ово није нешто лоше јер се не жури са издавањем које је резултирало Гоогле Бард даје погрешан одговор и много критика. Ово је нешто слично Бинг Цхатбот који је открио превише о свом систему као што је његово право име Сиднеј. То је такође резултирало Мицрософт ограничава Бинг АИ ћаскање на 5 одговора.
Најава ЛЛаМА-а је такође била прилично јединствена са само Фацебоок објавом и поруком на Инстаграму са Мета Цханнел-а. То је наведено“Данас ћемо објавити нови најсавременији АИ модел великог језика под називом ЛЛаМА дизајниран да помогне истраживачима да унапреде свој рад. ЛЛМ су показали много обећања у генерисању текста, вођењу разговора, сумирању писаног материјала и компликованијим задацима попут решавања математичких теорема или предвиђања протеинских структура. Мета је посвећена овом отвореном моделу истраживања и наш нови модел ћемо учинити доступним истраживачкој заједници АИ." Мета је такође узбуђена због тога како ће заједница учити и градити користећи ЛЛаМА.
Пратите нас за више ажурирања о технологији и најновијим иновацијама у АИ на ТецхЦулту!
Извор:Мета АИ блог