Meta liittyy AI Raceen julkaisee uuden kielimallin LLaMA
Sekalaista / / April 02, 2023
Vuosi 2023 on ollut tekoälyn alalla ennennäkemättömän kehityksen vuosi. ChatGPT: n julkaisun ja sen integroinnin jälkeen Microsoft Teams ja Bing, tekoälyareenan ympäristö kuumenee. Tämän yksipuolisen taipumuksen torjumiseksi Google keksi oman AI-mallinsa Bard, joka johti noin 12 000 irtisanomista. Nyt kolmas kilpailija Meta liittyy tekoälykilpailuun ja julkaisee uuden kielimallin LLaMA.
LLaMA tai Suuri kielimalli Meta AI, on suuri kielimalli, jonka sanotaan auttavan tutkijoita edistämään työtä muilla tekoälyn osa-alueilla. Se ei ole vain yksi kokonaisuus, vaan se sisältää useita aliversioita, jotka ovat kooltaan paljon pienempiä. Yhteenvetona se on "kokoelma peruskielimalleja, jotka vaihtelevat 7B - 65B parametreista."
- LLaMA: n ideana on, että pienemmät kielimallit lisäävät valtavasti tekoälyn tutkimuksen nopeutta, koska suurella yhteisöllä ei ole pääsyä näiden mallien tutkimiseen tarvittavaan infrastruktuuriin.
- Tämä julkaisu ei todellakaan osoita sen aikomusta kilpailla muiden AI-mallien, kuten ChatGPT: n tai Bardin, kanssa, joilla on kyky kommunikoida.
Meta tarjosi myös selkeän selityksen miksi he valitsivat pienempiä malleja. Se johtuu siitä, että heidät on helppo kouluttaa uudelleen, koska ne ovat koulutettuja sanojen tai merkkien avulla. Se edellytti myös, että sen alimallit LLaMA 65B ja LLaMA 33B on koulutettu 1,4 biljoonalla rahakkeella, kun taas pienin malli LLaMA 7B on 1 biljoona tokenia.
Täytyy lukea:YouChat 2.0 voisi kilpailla Google Bardin ja ChatGPT: n kanssa
Vaikka se ei ole tällä hetkellä saatavilla kaupallisesti julkaisussa mainituista syistä blogi. "Eheyden säilyttämiseksi ja väärinkäytön estämiseksi julkaisemme mallimme ei-kaupallisella lisenssillä, joka keskittyy tutkimuskäyttötapauksiin. Mallin käyttöoikeus myönnetään tapauskohtaisesti akateemisille tutkijoille; hallituksen, kansalaisyhteiskunnan ja korkeakoulujen organisaatioihin sidoksissa olevat; ja teollisuuden tutkimuslaboratoriot ympäri maailmaa."
Sisään Meta tutkimuspaperi, abstraktissa todettiin, että"Erityisesti LLaMA-13B ylittää GPT-3:n (175B) useimmissa vertailuissa, ja LLaMA-65B on kilpailukykyinen parhaiden mallien Chinchilla70B ja PaLM-540B kanssa." Nämä parhaat mallit kuuluvat DeepMindille ja Googlelle. Lisäksi se paljasti, että yritys käyttää vain julkisesti saatavilla olevia tietoja, mikä tekee mallista yhteensopivan avoimen lähdekoodin kanssa. Tämä on toisin kuin tekoälymallit, kuten DeepMind Chinchilla, Google PaLM tai OpenAI GPT-3, jotka käyttävät dokumentoimatonta tai julkisesti saatavilla olevaa dataa.
Suositus:Kuinka integroida ChatGPT Microsoft Wordiin
Sen jälkeen kun meta liittyy tekoälykilpailuun ja julkaisi uuden kielen Model LLaMA, on ollut ristiriidassa Google Bardin julkaisun kanssa pienellä kohulla. Tämä ei ole huono asia, koska se ei kiirehdi julkaisua, joka johti siihen Google Bard antaa väärän vastauksen ja paljon kritiikkiä. Tämä on jotain vastaavaa Bing Chatbot, joka paljasti liikaa sen järjestelmästä, kuten sen todellinen nimi on Sydney. Siitä seurasi myös Microsoft rajoittaa Bing AI -chatin viiteen vastaukseen.
LLaMA: n ilmoitus oli myös melkoinen pelkällä Facebook-julkaisulla ja Meta Channelin Instagram-viestillä. Siinä todettiin”, Julkaisemme tänään uuden huippuluokan tekoälyn suuren kielimallin nimeltä LLaMA, joka on suunniteltu auttamaan tutkijoita edistämään työtään. LLM: t ovat osoittaneet paljon lupauksia tekstin tuottamisessa, keskusteluissa, kirjoitetun materiaalin yhteenvedossa ja monimutkaisemmissa tehtävissä, kuten matemaattisten lauseiden ratkaisemisessa tai proteiinirakenteiden ennustamisessa. Meta on sitoutunut tähän avoimeen tutkimusmalliin ja tuomme uuden mallimme tekoälytutkimusyhteisön saataville. Meta on myös innoissaan siitä, kuinka yhteisö oppii ja rakentaa LLaMA: n avulla.
Pysy kuulolla saadaksesi lisää teknologiapäivityksiä ja viimeisimmät AI-innovaatiot TechCultissa!
Lähde:Meta AI -blogi