Meta se pridružuje AI Race. Izdaja nov jezikovni model LLaMA
Miscellanea / / April 02, 2023
Leto 2023 je bilo leto razvoja brez primere na področju umetne inteligence. Po izdaji ChatGPT in njegovi integraciji s Microsoft Teams in Bing, se okolje v areni AI segreva. Da bi se zoperstavil tej enostranski nagnjenosti, je Google pripravil lasten model AI Bard, ki je povzročil približno 12000 odpuščanj. Zdaj se tekmi z umetno inteligenco pridruži tretji kandidat Meta in izda nov jezikovni model LLaMA.
LLaMA oz Veliki jezikovni model Meta AI, je velik jezikovni model, ki naj bi pomagal raziskovalcem pri napredovanju dela v drugih vertikalah umetne inteligence. Ne gre le za eno samo entiteto, temveč za različne podrazličice, ki so veliko manjše. Če povzamem, je "zbirka modelov temeljnega jezika, ki segajo od parametrov 7B do 65B."
- Ideja za LLaMA je, da bodo manjši jezikovni modeli močno povečali hitrost raziskovanja umetne inteligence, saj velika skupnost nima dostopa do infrastrukture, potrebne za preučevanje teh modelov.
- Ta lansiranje v resnici ne kaže namena tekmovanja z drugimi modeli umetne inteligence, kot sta ChatGPT ali Bard, ki imajo sposobnost komuniciranja.
Meta je podala tudi razlago v lucidni obliki zakaj so izbrali manjše modele. To je zato, ker jih je enostavno prekvalificirati, saj se urijo na delčkih besed ali žetonov. Zagotovil je tudi, da sta njegova podmodela LLaMA 65B in LLaMA 33B usposobljena na 1,4 bilijona žetonov, medtem ko je najmanjši model LLaMA 7B na enem bilijonu žetonov.
Morati prebrati:YouChat 2.0 bi lahko bil konkurenčen Google Bardu in ChatGPT
Čeprav trenutno ne bo komercialno na voljo zaradi razlogov, navedenih v blog. »Da bi ohranili celovitost in preprečili zlorabo, izdajamo naš model pod nekomercialno licenco, osredotočeno na primere raziskovalne uporabe. Dostop do modela bo omogočen akademskim raziskovalcem za vsak primer posebej; tisti, ki so povezani z organizacijami v vladi, civilni družbi in akademskih krogih; in industrijski raziskovalni laboratoriji po vsem svetu.«
notri Meta Research članek, je v povzetku navedeno,”Zlasti LLaMA-13B prekaša GPT-3 (175B) na večini primerjalnih testov, LLaMA-65B pa je konkurenčen najboljšima modeloma Chinchilla70B in PaLM-540B.” Ti najboljši modeli pripadajo DeepMindu oziroma Googlu. Prav tako je razkrilo, da podjetje uporablja samo javno dostopne podatke, zaradi česar je model združljiv z odprto kodo. To je za razliko od modelov AI, kot so DeepMind Chinchilla, Google PaLM ali OpenAI GPT-3, ki uporabljajo nedokumentirane ali javno nedostopne podatke.
Priporočeno:Kako integrirati ChatGPT v Microsoft Word
Potem ko se meta pridruži dirki z umetno inteligenco in izda nov jezikovni model LLaMA, je bil v nasprotju z izdajo Google Bard z malo hrupa. To ni nekaj slabega, saj ne prehiteva izdaje, ki je povzročila Google Bard daje napačen odgovor in veliko kritik. To je nekaj podobnega Bing Chatbot, ki je razkril preveč o svojem sistemu, kot da je njegovo dejansko ime Sydney. Posledica je bila tudi Microsoft omejuje klepet Bing AI na 5 odgovorov.
Napoved LLaMA je bila prav tako precejšnja s samo objavo na Facebooku in sporočilom na Instagramu s kanala Meta. Navedeno je,« Danes bomo izdali nov najsodobnejši veliki jezikovni model AI, imenovan LLaMA, ki je zasnovan za pomoč raziskovalcem pri napredku pri njihovem delu. LLM-ji so veliko obetali pri ustvarjanju besedila, pogovorih, povzemanju pisnega gradiva in bolj zapletenih nalogah, kot je reševanje matematičnih izrekov ali napovedovanje proteinskih struktur. Meta je zavezana temu odprtemu modelu raziskav in naš novi model bomo dali na voljo raziskovalni skupnosti AI.« Meta je prav tako navdušena nad tem, kako se bo skupnost učila in gradila z uporabo LLaMA.
Ostanite z nami za več posodobitev o tehnologiji in najnovejših inovacijah v AI na TechCult!
Vir:Blog Meta AI