Meta מצטרפת למירוץ AI משחררת מודל שפה חדש LLaMA
Miscellanea / / April 02, 2023
שנת 2023 הייתה שנה של התפתחות חסרת תקדים בתחום הבינה המלאכותית. לאחר שחרורו של ChatGPT והשילוב שלו עם צוותי מיקרוסופט ובינג, הסביבה בזירת הבינה המלאכותית מתחממת. כדי להתמודד עם הנטייה החד-צדדית הזו גוגל המציאה דגם AI משלה בארד, שהביא לסביבה 12000 פיטורים. כעת מצטרף המתמודד השלישי Meta למירוץ AI ומשחרר מודל שפה חדש LLaMA.
LLaMA או מודל שפה גדול Meta AI, הוא מודל שפה גדול שאמור לסייע לחוקרים לקדם את העבודה באנכיים אחרים של AI. זה לא רק ישות בודדת אלא עם גרסאות משנה שונות שגודלן הרבה יותר קטן. לסיכום זה כן "אוסף של מודלים של שפת יסוד הנעים בין 7B עד 65B פרמטרים."
- הרעיון מאחורי LLaMA הוא שמודלים קטנים יותר של שפה יגדילו מאוד את מהירות המחקר ב-AI מכיוון שלקהילה גדולה אין גישה לתשתית הדרושה ללימוד המודלים הללו.
- ההשקה הזו לא ממש מראה את כוונתה להתחרות בדגמי AI אחרים כמו ChatGPT או Bard שיש להם את היכולת לתקשר.
מטה גם סיפקה הסבר בצורה ברורה מדוע הם בחרו בדגמים קטנים יותר. הסיבה לכך היא שקל לאמן אותם מחדש מכיוון שהם מאומנים על פיסות מילים או אסימונים. היא גם סיפקה שתת הדגמים שלה LLaMA 65B ו-LAMA 33B מאומנים על 1.4 טריליון אסימונים בעוד שהדגם הקטן ביותר LLaMA 7B הוא על טריליון אסימונים.
חייב לקרוא:YouChat 2.0 יכול להתחרות ב-Google Bard ו-ChatGPT
למרות שזה לא יהיה זמין מסחרית עכשיו מסיבות המפורטות ב בלוג. "כדי לשמור על היושרה ולמנוע שימוש לרעה, אנו משחררים את המודל שלנו ברישיון לא מסחרי המתמקד במקרים של שימוש במחקר. הגישה למודל תינתן על בסיס כל מקרה לגופו לחוקרים אקדמיים; אלה המזוהים עם ארגונים בממשל, בחברה האזרחית ובאקדמיה; ומעבדות מחקר בתעשייה ברחבי העולם".
ב מאמר מטה מחקר, התקציר קבע כי,"בפרט, LLaMA-13B מתעלה על GPT-3 (175B) ברוב המדדים, ו-LAMA-65B הוא תחרותי עם הדגמים הטובים ביותר Chinchilla70B ו-PaLM-540B." הדגמים הטובים ביותר האלה שייכים ל-DeepMind ו-Google בהתאמה. כמו כן, הוא חשף שהחברה עושה שימוש רק בנתונים זמינים לציבור, מה שהופך את המודל לתואם עם מקורות פתוחים. זה בניגוד למודלים של AI כגון DeepMind Chinchilla, Google PaLM או OpenAI GPT-3 המשתמשים בנתונים לא מתועדים או לא זמינים לציבור.
מוּמלָץ:כיצד לשלב את ChatGPT ב- Microsoft Word
לאחר שמטה מצטרפת למירוץ הבינה המלאכותית ומשחררת שפה חדשה מודל LLaMA, היה מסוכסך עם שחרור Google Bard עם קצת באזז. זה לא משהו רע מכיוון שהוא לא ממהר את השחרור שהביא גוגל בארד נותן תגובה שגויה והרבה ביקורת. זה משהו דומה ל Bing Chatbot שחשף יותר מדי על המערכת שלה כמו ששמה האמיתי הוא סידני. זה גם הביא מיקרוסופט מגבילה את הצ'אט של Bing AI ל-5 תשובות.
ההכרזה על LLaMA הייתה גם די אחת עם רק פוסט בפייסבוק והודעה באינסטגרם מערוץ Meta. זה קבע"היום אנחנו הולכים לשחרר מודל חדש של שפה בינה מלאכותית בינה מלאכותית בשם LLaMA שנועד לעזור לחוקרים לקדם את עבודתם. LLMs הראו הרבה הבטחה ביצירת טקסט, שיחות, סיכום חומר כתוב ומשימות מסובכות יותר כמו פתרון משפטי מתמטיקה או חיזוי מבני חלבון. Meta מחויבת למודל המחקר הפתוח הזה ואנו נהפוך את המודל החדש שלנו לזמין לקהילת מחקר הבינה המלאכותית". Meta מתרגשת גם מהאופן שבו הקהילה תלמד ותבנה באמצעות LLaMA.
הישאר מעודכן לעדכונים נוספים על טכנולוגיה והחידושים האחרונים ב-AI ב-TechCult!
מָקוֹר:בלוג Meta AI