Meta rejoint AI Race lance un nouveau modèle de langage LLaMA
Divers / / April 02, 2023
L'année 2023 a été une année de développement sans précédent dans le domaine de l'intelligence artificielle. Après la sortie de ChatGPT et son intégration avec Équipes Microsoft et Bing, l'environnement dans l'arène de l'IA se réchauffe. Pour contrer cette inclination unilatérale, Google a proposé son propre modèle d'IA Bard qui a abouti à environ 12000 licenciements. Maintenant, le troisième concurrent Meta rejoint la course à l'IA et publie un nouveau modèle de langage LLaMA.
LLaMA ou Méta IA du grand modèle de langage, est un grand modèle de langage censé aider les chercheurs à faire avancer les travaux dans d'autres secteurs verticaux de l'IA. Il ne s'agit pas d'une seule entité, mais de plusieurs sous-versions beaucoup plus petites. Pour résumer c'est "une collection de modèles de langage de base allant de paramètres 7B à 65B."
- L'idée derrière LLaMA est que des modèles de langage plus petits augmenteront considérablement la vitesse de la recherche en IA car une grande communauté n'a pas accès à l'infrastructure nécessaire pour étudier ces modèles.
- Ce lancement ne montre pas vraiment son intention de concurrencer d'autres modèles d'IA comme ChatGPT ou Bard qui ont la capacité de communiquer.
Meta a également fourni une explication sous forme lucide pourquoi ils ont choisi des modèles plus petits. C'est parce qu'ils sont faciles à recycler car ils sont entraînés sur des morceaux de mots ou des jetons. Il a également prévu que ses sous-modèles LLaMA 65B et LLaMA 33B soient formés sur 1,4 billion de jetons tandis que le plus petit modèle LLaMA 7B est sur un billion de jetons.
Doit lire:YouChat 2.0 pourrait rivaliser avec Google Bard et ChatGPT
Bien qu'il ne soit pas disponible dans le commerce pour le moment pour les raisons indiquées dans le Blog. « Pour maintenir l'intégrité et éviter les abus, nous publions notre modèle sous une licence non commerciale axée sur les cas d'utilisation de la recherche. L'accès au modèle sera accordé au cas par cas aux chercheurs universitaires; ceux affiliés à des organisations du gouvernement, de la société civile et du milieu universitaire; et les laboratoires de recherche de l'industrie à travers le monde.
Dans Document de méta-recherche, le résumé indiquait que,"En particulier, LLaMA-13B surpasse GPT-3 (175B) sur la plupart des benchmarks, et LLaMA-65B est compétitif avec les meilleurs modèles Chinchilla70B et PaLM-540B." Ces meilleurs modèles appartiennent respectivement à DeepMind et Google. En outre, il a révélé que l'entreprise n'utilise que des données accessibles au public, ce qui rend le modèle compatible avec l'open source. Ceci est différent des modèles d'IA tels que DeepMind Chinchilla, Google PaLM ou OpenAI GPT-3 qui utilisent des données non documentées ou publiquement non disponibles.
Recommandé:Comment intégrer ChatGPT dans Microsoft Word
Après que meta ait rejoint la course à l'IA et publié un nouveau modèle de langage LLaMA, il a été en désaccord avec la sortie de Google Bard avec un peu de buzz. Ce n'est pas quelque chose de mal car il ne précipite pas la sortie qui a abouti à Google Bard donne une mauvaise réponse et beaucoup de critiques. C'est quelque chose de semblable à Bing Chatbot qui en a trop révélé à propos de son système comme son vrai nom est Sydney. Il en résulta également Microsoft limite le chat Bing AI à 5 réponses.
L'annonce de LLaMA était également assez unique avec juste une publication sur Facebook et un message sur Instagram de Meta Channel. Il a déclaré" Aujourd'hui, nous allons publier un nouveau modèle de grand langage d'IA à la pointe de la technologie appelé LLaMA, conçu pour aider les chercheurs à faire avancer leurs travaux. Les LLM se sont révélés très prometteurs pour générer du texte, avoir des conversations, résumer des documents écrits et des tâches plus compliquées comme la résolution de théorèmes mathématiques ou la prédiction de structures protéiques. Meta est attaché à ce modèle de recherche ouvert et nous mettrons notre nouveau modèle à la disposition de la communauté de recherche en IA. » Meta est également enthousiasmé par la façon dont la communauté apprendra et construira en utilisant LLaMA.
Restez à l'écoute pour plus de mises à jour sur la technologie et les dernières innovations en matière d'IA sur TechCult !
Source:Blog sur la méta-IA