Meta schließt sich AI Race an und veröffentlicht neues Sprachmodell LLaMA
Verschiedenes / / April 02, 2023
Das Jahr 2023 war ein Jahr beispielloser Entwicklung im Bereich der künstlichen Intelligenz. Nach der Veröffentlichung von ChatGPT und seiner Integration mit Microsoft Teams und Bing heizt sich die Umgebung in der KI-Arena auf. Um dieser einseitigen Neigung entgegenzuwirken, hat Google sein eigenes KI-Modell Bard entwickelt, das zu rund geführt hat 12000 Entlassungen. Jetzt steigt der dritte Anwärter Meta in das KI-Rennen ein und veröffentlicht ein neues Sprachmodell LLaMA.
LLaMA bzw Große Sprachmodell-Meta-KI, ist ein großes Sprachmodell, das Forschern helfen soll, die Arbeit in anderen Branchen der KI voranzutreiben. Es ist nicht nur eine einzelne Entität, sondern mit verschiedenen Unterversionen, die viel kleiner sind. Zusammenfassend ist es „eine Sammlung von grundlegenden Sprachmodellen mit 7B- bis 65B-Parametern.“
- Die Idee hinter LLaMA ist, dass kleinere Sprachmodelle die Forschungsgeschwindigkeit in der KI enorm erhöhen werden, da eine große Gemeinschaft keinen Zugang zu der Infrastruktur hat, die zum Studium dieser Modelle erforderlich ist.
- Dieser Start zeigt nicht wirklich seine Absicht, mit anderen KI-Modellen wie ChatGPT oder Bard zu konkurrieren, die über die Fähigkeit zur Kommunikation verfügen.
Meta lieferte auch eine Erklärung in luzider Form warum sie sich für kleinere Modelle entschieden haben. Das liegt daran, dass sie leicht umzuschulen sind, da sie auf Wortstücke oder Token trainiert werden. Es hat auch vorausgesetzt, dass seine Untermodelle LLaMA 65B und LLaMA 33B auf 1,4 Billionen Token trainiert werden, während das kleinste Modell LLaMA 7B auf einer Billion Token liegt.
Muss lesen:YouChat 2.0 könnte Google Bard und ChatGPT Konkurrenz machen
Obwohl es derzeit aus Gründen, die in der angegeben sind, nicht im Handel erhältlich sein wird bloggen. „Um die Integrität zu wahren und Missbrauch zu verhindern, veröffentlichen wir unser Modell unter einer nichtkommerziellen Lizenz, die sich auf Forschungsanwendungsfälle konzentriert. Der Zugang zum Modell wird akademischen Forschern fallweise gewährt; diejenigen, die mit Organisationen in der Regierung, der Zivilgesellschaft und der Wissenschaft verbunden sind; und Industrieforschungslabors auf der ganzen Welt.“
In Meta Research-Papier, heißt es in der Zusammenfassung,„Insbesondere LLaMA-13B übertrifft GPT-3 (175B) bei den meisten Benchmarks, und LLaMA-65B ist mit den besten Modellen Chinchilla70B und PaLM-540B konkurrenzfähig.“ Diese besten Modelle gehören DeepMind bzw. Google. Außerdem zeigte sich, dass das Unternehmen nur öffentlich verfügbare Daten verwendet, was das Modell mit Open Source kompatibel macht. Dies ist anders als bei KI-Modellen wie DeepMind Chinchilla, Google PaLM oder OpenAI GPT-3, die undokumentierte oder öffentlich nicht verfügbare Daten verwenden.
Empfohlen:So integrieren Sie ChatGPT in Microsoft Word
Nachdem Meta sich dem KI-Rennen anschließt und ein neues Sprachmodell LLaMA veröffentlicht, war es mit der Veröffentlichung von Google Bard mit einem kleinen Aufsehen uneins. Das ist nichts Schlechtes, da es die Veröffentlichung, die daraus resultierte, nicht übereilt Google Bard gibt falsche Antwort und viel Kritik. Das ist etwas ähnliches Bing Chatbot, der zu viel verraten hat über sein System, als wäre sein richtiger Name Sydney. Daraus resultierte auch Microsoft beschränkt den Bing-KI-Chat auf 5 Antworten.
Die Ankündigung von LLaMA war auch ziemlich eins mit nur einem Facebook-Post und einer Nachricht auf Instagram von Meta Channel. Es erklärte“Heute werden wir ein neues, hochmodernes KI-Large-Language-Modell namens LLaMA veröffentlichen, das Forschern helfen soll, ihre Arbeit voranzutreiben. LLMs haben sich beim Generieren von Text, beim Führen von Gesprächen, beim Zusammenfassen von schriftlichem Material und bei komplizierteren Aufgaben wie dem Lösen mathematischer Theoreme oder der Vorhersage von Proteinstrukturen als vielversprechend erwiesen. Meta engagiert sich für dieses offene Forschungsmodell und wir werden unser neues Modell der KI-Forschungsgemeinschaft zur Verfügung stellen.“ Meta ist auch gespannt, wie die Community mit LLaMA lernen und bauen wird.
Bleiben Sie auf dem Laufenden für weitere Updates zur Technik und die neuesten Innovationen in der KI auf TechCult!
Quelle:Meta-KI-Blog