Meta liitub AI Race'iga, avaldab uue keelemudeli LLaMA
Miscellanea / / April 02, 2023
2023. aasta on tehisintellekti valdkonnas olnud enneolematu arengu aasta. Pärast ChatGPT väljaandmist ja selle integreerimist Microsoft Teams ja Bing, keskkond AI areenil kuumeneb. Selle ühekülgse kalduvuse vastu võitlemiseks tuli Google välja oma tehisintellekti mudeliga Bard, mille tulemuseks oli umbes 12 000 koondamist. Nüüd liitub AI võidujooksuga kolmas pretendent Meta ja annab välja uue keelemudeli LLaMA.
LLaMA või Suur keelemudel Meta AI, on suur keelemudel, mis väidetavalt aitab teadlastel edendada tööd tehisintellekti teistes vertikaalides. See ei ole ainult üks üksus, vaid erinevate alamversioonidega, mis on palju väiksema suurusega. Kokkuvõtteks on "Sundamendi keelemudelite kogumik parameetritega 7B kuni 65B."
- LLaMA idee seisneb selles, et väiksemad keelemudelid suurendavad oluliselt tehisintellekti uurimise kiirust, kuna suurel kogukonnal pole juurdepääsu nende mudelite uurimiseks vajalikule infrastruktuurile.
- See käivitamine ei näita tegelikult oma kavatsust konkureerida teiste AI-mudelitega, nagu ChatGPT või Bard, millel on võime suhelda.
Meta andis ka selgel kujul selgituse miks nad valisid väiksemad mudelid. Põhjus on selles, et neid on lihtne ümber õpetada, kuna neid õpetatakse sõnade või märkide järgi. Samuti nägi see ette, et selle alammudeleid LLaMA 65B ja LLaMA 33B treenitakse 1,4 triljoni žetooniga, samas kui väikseim mudel LLaMA 7B on triljonil märgil.
Pead lugema:YouChat 2.0 võiks konkureerida Google Bardi ja ChatGPT-ga
Kuigi see ei ole praegu kaubanduslikult saadaval dokumendis märgitud põhjustel ajaveebi. "Terviklikkuse säilitamiseks ja väärkasutuse vältimiseks anname oma mudeli välja mitteärilise litsentsi alusel, mis keskendub uurimistööle. Juurdepääs mudelile võimaldatakse akadeemilistele teadlastele igal üksikjuhul eraldi; need, kes on seotud valitsuse, kodanikuühiskonna ja akadeemiliste ringkondade organisatsioonidega; ja tööstuse uurimislaborid üle maailma.
sisse Meta uurimistöö, kokkuvõttes väideti, et"Eelkõige ületab LLaMA-13B GPT-3 (175B) enamiku võrdlusnäitajate puhul ja LLaMA-65B on konkurentsivõimeline parimate mudelitega Chinchilla70B ja PaLM-540B." Need parimad mudelid kuuluvad vastavalt DeepMindile ja Google'ile. Samuti selgus, et ettevõte kasutab ainult avalikult kättesaadavaid andmeid, mis muudab mudeli avatud allikaga ühilduvaks. See erineb tehisintellekti mudelitest, nagu DeepMind Chinchilla, Google PaLM või OpenAI GPT-3, mis kasutavad dokumenteerimata või avalikult kättesaamatuid andmeid.
Soovitatav:Kuidas integreerida ChatGPT Microsoft Wordi
Pärast seda, kui meta liitub tehisintellektiga ja annab välja uue keele Model LLaMA, on Google Bardi väljalaskega pisut vastuollu sattunud. See pole midagi halba, kuna see ei kiirusta vabastamist, mille tulemuseks oli Google Bard annab vale vastuse ja palju kriitikat. See on midagi sarnast Bing Chatbot, mis paljastas liiga palju oma süsteemi kohta nagu selle tegelik nimi on Sydney. Selle tulemuseks oli ka Microsoft piirab Bing AI vestluse 5 vastusega.
LLaMA teadaanne oli ka üsna üks, vaid Facebooki postituse ja Instagrami sõnumiga Meta Channelilt. Selles väideti"Täna avaldame uue tipptasemel tehisintellekti suure keelemudeli nimega LLaMA, mis on loodud teadlaste töö edendamiseks. LLM-id on näidanud palju lubadusi teksti loomisel, vestlustel, kirjaliku materjali kokkuvõtte tegemisel ja keerulisemates ülesannetes, nagu matemaatika teoreemide lahendamine või valgustruktuuride ennustamine. Meta on pühendunud sellele avatud uurimismudelile ja teeme oma uue mudeli tehisintellekti teadlaskonnale kättesaadavaks. Meta on põnevil ka selle üle, kuidas kogukond LLaMA abil õpib ja ehitab.
Olge kursis, et saada rohkem uuendusi tehnoloogia kohta ja uusimaid tehisintellekti uuendusi TechCultis!
Allikas:Meta AI ajaveeb