Meta se pridružuje AI utrci Izdaje novi jezični model LLaMA
Miscelanea / / April 02, 2023
Godina 2023. bila je godina razvoja bez presedana u području umjetne inteligencije. Nakon izdavanja ChatGPT-a i njegove integracije s Microsoftovi timovi i Bing, okruženje u AI areni se zahuktava. Kako bi se suprotstavio ovoj jednostranoj sklonosti Google je smislio vlastiti AI model Bard koji je rezultirao oko 12000 otkaza. Sada se treći kandidat Meta pridružuje AI utrci i izdaje novi jezični model LLaMA.
LLaMA ili Veliki jezični model Meta AI, veliki je jezični model za koji se kaže da pomaže istraživačima da unaprijede rad u drugim vertikalama umjetne inteligencije. To nije samo jedna cjelina, već s različitim pod-verzijama koje su mnogo manje veličine. Da rezimiramo jest "zbirka modela temeljnog jezika u rasponu od 7B do 65B parametara."
- Ideja iza LLaMA-e je da će manji jezični modeli uvelike povećati brzinu istraživanja u AI jer velika zajednica nema pristup infrastrukturi potrebnoj za proučavanje tih modela.
- Ovo lansiranje zapravo ne pokazuje svoju namjeru da se natječe s drugim AI modelima poput ChatGPT-a ili Barda koji imaju sposobnost komunikacije.
Meta je također dao objašnjenje u lucidnom obliku zašto su odabrali manje modele. To je zato što ih je lako prekvalificirati jer se treniraju na djelićima riječi ili žetonima. Također je osigurao da su njegovi pod-modeli LLaMA 65B i LLaMA 33B trenirani na 1,4 bilijuna tokena, dok je najmanji model LLaMA 7B na jednom bilijunu tokena.
Obavezno pročitati:YouChat 2.0 mogao bi konkurirati Google Bardu i ChatGPT-u
Iako trenutno neće biti komercijalno dostupan iz razloga navedenih u blog. “Kako bismo održali integritet i spriječili zlouporabu, objavljujemo naš model pod nekomercijalnom licencom usmjerenom na slučajeve korištenja u istraživanju. Pristup modelu bit će odobren od slučaja do slučaja akademskim istraživačima; oni koji su povezani s organizacijama u vladi, civilnom društvu i akademskoj zajednici; i industrijskih istraživačkih laboratorija diljem svijeta.”
U Meta Research rad, u sažetku je navedeno da,”Konkretno, LLaMA-13B nadmašuje GPT-3 (175B) na većini mjerila, a LLaMA-65B je konkurentan najboljim modelima Chinchilla70B i PaLM-540B.” Ovi najbolji modeli pripadaju DeepMind-u odnosno Googleu. Također, otkriveno je da tvrtka koristi samo javno dostupne podatke što model čini kompatibilnim s open-sourceingom. Ovo je za razliku od AI modela kao što su DeepMind Chinchilla, Google PaLM ili OpenAI GPT-3 koji koriste nedokumentirane ili javno nedostupne podatke.
Preporučeno:Kako integrirati ChatGPT u Microsoft Word
Nakon što se meta pridružio AI utrci i izdao novi jezik Model LLaMA, bio je u sukobu s izdanjem Google Barda s malo buke. Ovo nije nešto loše jer nije požurivanje izdanja koje je rezultiralo Google Bard daje pogrešan odgovor i puno kritika. Ovo je nešto slično Bing Chatbot koji je otkrio previše o svom sustavu kao da je njegovo pravo ime Sydney. To je također rezultiralo Microsoft ograničava Bing AI chat na 5 odgovora.
Najava LLaMA-e također je bila prilično jedna sa samo objavom na Facebooku i porukom na Instagramu od Meta kanala. Navedeno je,” Danas ćemo objaviti novi najsuvremeniji veliki jezični model AI pod nazivom LLaMA koji je osmišljen kako bi pomogao istraživačima da unaprijede svoj rad. LLM su pokazali mnogo obećanja u generiranju teksta, razgovorima, sažimanju pisanog materijala i kompliciranijim zadacima poput rješavanja matematičkih teorema ili predviđanja strukture proteina. Meta je predana ovom otvorenom modelu istraživanja i učinit ćemo naš novi model dostupnim istraživačkoj zajednici umjetne inteligencije.” Meta je također uzbuđena zbog toga kako će zajednica učiti i graditi pomoću LLaMA-e.
Ostanite s nama za više novosti o tehnologiji i najnovijim inovacijama u AI na TechCultu!
Izvor:Meta AI blog