Meta si unisce a AI Race rilascia il nuovo modello linguistico LLaMA
Varie / / April 02, 2023
L'anno 2023 è stato un anno di sviluppo senza precedenti nel campo dell'intelligenza artificiale. Dopo il rilascio di ChatGPT e la sua integrazione con Team Microsoft e Bing, l'ambiente nell'arena dell'IA si sta surriscaldando. Per contrastare questa inclinazione unilaterale, Google ha inventato il proprio modello di intelligenza artificiale Bard che ha portato in giro 12000 licenziamenti. Ora il terzo contendente Meta si unisce alla corsa AI e rilascia un nuovo modello di linguaggio LLaMA.
LLaMA o Modello di linguaggio di grandi dimensioni Meta AI, è un modello linguistico di grandi dimensioni che si dice aiuti i ricercatori a far avanzare il lavoro in altri verticali dell'IA. Non è solo una singola entità ma con varie sotto-versioni di dimensioni molto più ridotte. Per riassumere lo è "una raccolta di modelli linguistici di base che vanno dai parametri 7B a 65B."
- L'idea alla base di LLaMA è che i modelli linguistici più piccoli aumenteranno enormemente la velocità della ricerca nell'IA poiché una grande comunità non ha accesso all'infrastruttura necessaria per studiare questi modelli.
- Questo lancio non mostra davvero la sua intenzione di competere con altri modelli di intelligenza artificiale come ChatGPT o Bard che hanno la capacità di comunicare.
Meta ha anche fornito una spiegazione in forma lucida perché hanno scelto modelli più piccoli. È perché sono facili da riaddestrare poiché sono addestrati su pezzi di parole o segni. Ha inoltre previsto che i suoi sottomodelli LLaMA 65B e LLaMA 33B siano addestrati su 1,4 trilioni di token mentre il modello più piccolo LLaMA 7B è su un trilione di token.
Devi leggere:YouChat 2.0 potrebbe rivaleggiare con Google Bard e ChatGPT
Sebbene non sarà disponibile in commercio in questo momento per i motivi indicati nel blog. “Per mantenere l'integrità e prevenire l'uso improprio, stiamo rilasciando il nostro modello con una licenza non commerciale incentrata sui casi d'uso di ricerca. L'accesso al modello sarà concesso caso per caso ai ricercatori accademici; quelli affiliati a organizzazioni governative, della società civile e del mondo accademico; e laboratori di ricerca industriale in tutto il mondo.”
In Documento Meta Research, l'abstract affermava che,"In particolare, LLaMA-13B supera GPT-3 (175B) nella maggior parte dei benchmark e LLaMA-65B è competitivo con i migliori modelli Chinchilla70B e PaLM-540B." Questi migliori modelli appartengono rispettivamente a DeepMind e Google. Inoltre, ha rivelato che la società utilizza solo dati pubblicamente disponibili che rendono il modello compatibile con l'open-sourcing. Questo è diverso dai modelli AI come DeepMind Chinchilla, Google PaLM o OpenAI GPT-3 che utilizzano dati non documentati o non disponibili pubblicamente.
Consigliato:Come integrare ChatGPT in Microsoft Word
Dopo che il meta si è unito alla gara AI e ha rilasciato un nuovo modello di linguaggio LLaMA, è stato in disaccordo con il rilascio di Google Bard con un piccolo ronzio. Questo non è qualcosa di brutto in quanto non sta affrettando il rilascio che ne è derivato Google Bard ha dato una risposta sbagliata e molte critiche. Questo è qualcosa di simile a Bing Chatbot che ha rivelato troppo sul suo sistema come il suo vero nome è Sydney. Ne è derivato anche Microsoft limita la chat di Bing AI a 5 risposte.
Anche l'annuncio di LLaMA è stato piuttosto uno con solo un post su Facebook e un messaggio su Instagram da Meta Channel. Ha dichiarato"Oggi rilasceremo un nuovo modello di linguaggio di grandi dimensioni AI all'avanguardia chiamato LLaMA progettato per aiutare i ricercatori a far progredire il loro lavoro. Gli LLM hanno mostrato molte promesse nel generare testo, conversare, riassumere materiale scritto e compiti più complicati come risolvere teoremi matematici o prevedere strutture proteiche. Meta è impegnata in questo modello di ricerca aperto e renderemo disponibile il nostro nuovo modello alla comunità di ricerca sull'IA". Meta è anche entusiasta di come la comunità imparerà e costruirà utilizzando LLaMA.
Resta sintonizzato per ulteriori aggiornamenti sulla tecnologia e le ultime innovazioni nell'IA su TechCult!
Fonte:Blog MetaAI