Meta dołącza do AI Race i wydaje nowy model językowy LLaMA
Różne / / April 02, 2023
Rok 2023 był rokiem bezprecedensowego rozwoju w dziedzinie Sztucznej Inteligencji. Po wydaniu ChatGPT i jego integracji z Zespoły Microsoftu i Bing, środowisko na arenie sztucznej inteligencji się nagrzewa. Aby przeciwdziałać tej jednostronnej tendencji, Google wymyślił własny model AI Bard, który zaowocował ok 12 000 zwolnień. Teraz trzeci pretendent Meta dołącza do wyścigu AI i wypuszcza nowy model językowy LLaMA.
LLaMA lub Meta AI modelu dużego języka, to duży model językowy, który ma pomagać naukowcom w rozwijaniu prac w innych pionach sztucznej inteligencji. Nie jest to tylko pojedyncza jednostka, ale z różnymi wersjami podrzędnymi, które są znacznie mniejsze. Podsumowując jest „zbiór podstawowych modeli językowych w zakresie od parametrów 7B do 65B”.
- Ideą LLaMA jest to, że mniejsze modele językowe znacznie zwiększą szybkość badań nad sztuczną inteligencją, ponieważ duża społeczność nie ma dostępu do infrastruktury potrzebnej do badania tych modeli.
- Ta premiera tak naprawdę nie pokazuje swojego zamiaru konkurowania z innymi modelami AI, takimi jak ChatGPT lub Bard, które mają zdolność komunikowania się.
Meta przedstawiła również wyjaśnienie w przejrzystej formie dlaczego wybrali mniejsze modele. Dzieje się tak, ponieważ łatwo je przeszkolić, ponieważ są szkolone na fragmentach słów lub tokenach. Zapewnił również, że jego podmodele LLaMA 65B i LLaMA 33B są szkolone na 1,4 biliona tokenów, podczas gdy najmniejszy model LLaMA 7B jest na jednym bilionie tokenów.
Musisz przeczytać:YouChat 2.0 może konkurować z Google Bard i ChatGPT
Chociaż nie będzie teraz dostępny w sprzedaży z powodów określonych w blog. „Aby zachować integralność i zapobiec nadużyciom, udostępniamy nasz model na licencji niekomercyjnej, koncentrującej się na badaniach przypadków użycia. Dostęp do modelu będzie przyznawany na zasadzie indywidualnych przypadków naukowcom akademickim; osoby powiązane z organizacjami rządowymi, społeczeństwem obywatelskim i środowiskiem akademickim; i przemysłowych laboratoriów badawczych na całym świecie.”
W Artykuł Meta Researchw streszczeniu stwierdzono, że„W szczególności LLaMA-13B przewyższa GPT-3 (175B) w większości testów porównawczych, a LLaMA-65B konkuruje z najlepszymi modelami Chinchilla70B i PaLM-540B”. Te najlepsze modele należą odpowiednio do DeepMind i Google. Ujawniono również, że firma korzysta wyłącznie z publicznie dostępnych danych, co czyni model kompatybilnym z open-sourcingiem. Różni się to od modeli AI, takich jak DeepMind Chinchilla, Google PaLM lub OpenAI GPT-3, które wykorzystują nieudokumentowane lub publicznie niedostępne dane.
Zalecana:Jak zintegrować ChatGPT z Microsoft Word
Po tym, jak meta dołącza do wyścigu AI i wypuszcza nowy język Model LLaMA, był w sprzeczności z wydaniem Google Bard z niewielkim szumem. To nie jest coś złego, ponieważ nie spieszy się z wydaniem, które zaowocowało Google Bard podaje błędną odpowiedź i dużo krytyki. To jest coś podobnego do Bing Chatbot, który ujawnił zbyt wiele o swoim systemie, jakby jego rzeczywista nazwa to Sydney. Skutkowało to również Microsoft ogranicza czat Bing AI do 5 odpowiedzi.
Ogłoszenie LLaMA było również całkiem niezłe z postem na Facebooku i wiadomością na Instagramie z Meta Channel. Stwierdzono”, Dzisiaj opublikujemy nowy, najnowocześniejszy model dużego języka sztucznej inteligencji o nazwie LLaMA, który ma pomóc naukowcom w rozwijaniu ich pracy. LLM okazały się bardzo obiecujące w generowaniu tekstu, prowadzeniu rozmów, podsumowywaniu materiałów pisanych i bardziej skomplikowanych zadaniach, takich jak rozwiązywanie twierdzeń matematycznych lub przewidywanie struktur białek. Meta jest zaangażowana w ten otwarty model badań i udostępnimy nasz nowy model społeczności badawczej zajmującej się sztuczną inteligencją”. Meta jest również podekscytowana tym, jak społeczność będzie się uczyć i budować przy użyciu LLaMA.
Bądź na bieżąco, aby uzyskać więcej informacji o technologii i najnowszych innowacjach w sztucznej inteligencji w TechCult!
Źródło:Blog Meta AI