Meta უერთდება AI Race-ს ავრცელებს ახალ ენობრივ მოდელს LLaMA
Miscellanea / / April 02, 2023
2023 წელი იყო ხელოვნური ინტელექტის სფეროში უპრეცედენტო განვითარების წელი. ChatGPT-ის გამოშვების და მასთან ინტეგრაციის შემდეგ Microsoft-ის გუნდები და Bing, AI არენაზე გარემო თბება. ამ ცალმხრივი მიდრეკილების წინააღმდეგ საბრძოლველად Google-მა გამოუშვა საკუთარი ხელოვნური ინტელექტის მოდელი Bard, რომლის შედეგადაც დაახლოებით 12000 თანამდებობიდან გათავისუფლება. ახლა მესამე კონკურენტი Meta უერთდება AI რბოლას და აქვეყნებს ახალ ენობრივ მოდელს LLaMA.
LLaMA ან დიდი ენის მოდელი Meta AI, არის დიდი ენის მოდელი, რომელიც, როგორც ამბობენ, ეხმარება მკვლევარებს AI-ის სხვა ვერტიკალებში მუშაობის წინსვლაში. ეს არ არის მხოლოდ ერთი ერთეული, არამედ სხვადასხვა ქვევერსიით, რომლებიც გაცილებით მცირე ზომისაა. შეჯამება ასეა "ძირითადი ენის მოდელების კოლექცია, რომელიც მერყეობს 7B-დან 65B პარამეტრამდე."
- იდეა LLaMA-ს მიღმა მდგომარეობს იმაში, რომ მცირე ენობრივი მოდელები საგრძნობლად გაზრდის AI-ში კვლევის სიჩქარეს, რადგან დიდ საზოგადოებას არ აქვს წვდომა ამ მოდელების შესასწავლად საჭირო ინფრასტრუქტურაზე.
- ეს გაშვება ნამდვილად არ აჩვენებს მის განზრახვას კონკურენცია გაუწიოს სხვა AI მოდელებს, როგორიცაა ChatGPT ან Bard, რომლებსაც აქვთ კომუნიკაციის უნარი.
მეტამ განმარტება ნათელი ფორმითაც მოგვაწოდა რატომ აირჩიეს პატარა მოდელები. ეს იმიტომ ხდება, რომ მათი გადამზადება ადვილია, რადგან ისინი ივარჯიშებენ სიტყვებზე ან ნიშნებზე. იგი ასევე ითვალისწინებდა, რომ მისი ქვემოდელები LLaMA 65B და LLaMA 33B გაწვრთნილი არიან 1.4 ტრილიონ ტოკენზე, ხოლო ყველაზე პატარა მოდელი LLaMA 7B არის ტრილიონ ტოკენზე.
Უნდა წაიკითხო:YouChat 2.0-ს შეუძლია კონკურენცია გაუწიოს Google Bard-სა და ChatGPT-ს
მიუხედავად იმისა, რომ ის ახლა კომერციულად არ იქნება ხელმისაწვდომი ამ სტატიაში მითითებული მიზეზების გამო ბლოგი. „მთლიანობის შესანარჩუნებლად და ბოროტად გამოყენების თავიდან ასაცილებლად, ჩვენ გამოვუშვით ჩვენი მოდელი არაკომერციული ლიცენზიით, რომელიც ორიენტირებულია კვლევის გამოყენების შემთხვევებზე. მოდელზე წვდომა მიენიჭება აკადემიურ მკვლევარებს ინდივიდუალურად; მთავრობის, სამოქალაქო საზოგადოებისა და აკადემიის ორგანიზაციებთან დაკავშირებულები; და ინდუსტრიის კვლევითი ლაბორატორიები მთელს მსოფლიოში.”
In მეტა კვლევის ნაშრომიაბსტრაქტში ნათქვამია, რომ,”კერძოდ, LLaMA-13B აჯობებს GPT-3-ს (175B) უმეტეს კრიტერიუმებში, ხოლო LLaMA-65B კონკურენტუნარიანია საუკეთესო მოდელებთან Chinchilla70B და PaLM-540B.” ეს საუკეთესო მოდელები ეკუთვნის DeepMind-ს და Google-ს. ასევე, გაირკვა, რომ კომპანია იყენებს მხოლოდ საჯაროდ ხელმისაწვდომ მონაცემებს, რაც მოდელს თავსებადია ღია წყაროსთან. ეს განსხვავდება ხელოვნური ინტელექტის მოდელებისგან, როგორიცაა DeepMind Chinchilla, Google PaLM ან OpenAI GPT-3, რომლებიც იყენებენ დაუსაბუთებელ ან საჯაროდ მიუწვდომელ მონაცემებს.
რეკომენდებულია:როგორ გავაერთიანოთ ChatGPT Microsoft Word-ში
მას შემდეგ, რაც მეტა შეუერთდება AI რბოლას და გამოუშვებს ახალ ენას Model LLaMA, ეწინააღმდეგება Google Bard-ის გამოშვებას მცირე ხმაურით. ეს ცუდი არ არის, რადგან არ ჩქარობს გამოშვებას, რამაც გამოიწვია Google Bard იძლევა არასწორ პასუხს და ბევრი კრიტიკა. ეს არის რაღაც მსგავსი Bing Chatbot, რომელმაც ძალიან ბევრი გამოავლინა მისი სისტემის შესახებ, ისევე როგორც მისი ნამდვილი სახელია სიდნეი. ამასაც მოჰყვა Microsoft ზღუდავს Bing AI ჩეთს 5 პასუხით.
LLaMA-ს ანონსი ასევე საკმაოდ ერთი იყო მხოლოდ Facebook პოსტით და მეტა არხის ინსტაგრამზე გაგზავნილი მესიჯით. ნათქვამია”დღეს ჩვენ ვაპირებთ გამოვუშვათ ახალი თანამედროვე ხელოვნური ხელოვნური ინტელექტის დიდი ენის მოდელი, სახელწოდებით LLaMA, რომელიც შექმნილია მკვლევარებისთვის მუშაობის წინსვლაში. LLM-ებმა აჩვენეს ბევრი დაპირება ტექსტის გენერირებაში, საუბრებში, წერილობითი მასალის შეჯამებაში და უფრო რთულ ამოცანებში, როგორიცაა მათემატიკის თეორემების ამოხსნა ან ცილის სტრუქტურების პროგნოზირება. მეტა ერთგულია კვლევის ამ ღია მოდელის მიმართ და ჩვენ ახალ მოდელს ხელმისაწვდომს გავხდით ხელოვნური ინტელექტის მკვლევარების საზოგადოებისთვის.” მეტა ასევე აღფრთოვანებულია იმით, თუ როგორ ისწავლის და ააშენებს საზოგადოება LLaMA-ს გამოყენებით.
თვალყური ადევნეთ უფრო მეტ განახლებებს ტექნოლოგიასა და AI-ის უახლეს ინოვაციებს TechCult-ზე!
წყარო:მეტა AI ბლოგი