Η Meta Joins Race AI Κυκλοφορεί το νέο γλωσσικό μοντέλο LLaMA
Miscellanea / / April 02, 2023
Το 2023 ήταν μια χρονιά άνευ προηγουμένου ανάπτυξης στον τομέα της Τεχνητής Νοημοσύνης. Μετά την κυκλοφορία του ChatGPT και την ενσωμάτωσή του με Ομάδες της Microsoft και το Bing, το περιβάλλον στην αρένα της τεχνητής νοημοσύνης θερμαίνεται. Για να αντιμετωπίσει αυτή τη μονόπλευρη κλίση, η Google δημιούργησε το δικό της μοντέλο τεχνητής νοημοσύνης Bard, το οποίο είχε ως αποτέλεσμα 12000 απολύσεις. Τώρα ο τρίτος υποψήφιος Meta συμμετέχει στον αγώνα AI και κυκλοφορεί ένα νέο μοντέλο γλώσσας LLaMA.
LLaMA ή Large Language Model Meta AI, είναι ένα μεγάλο γλωσσικό μοντέλο που λέγεται ότι βοηθά τους ερευνητές να προωθήσουν την εργασία σε άλλους κλάδους της τεχνητής νοημοσύνης. Δεν είναι απλώς μια ενιαία οντότητα αλλά με διάφορες υπο-εκδόσεις που είναι πολύ μικρότερες σε μέγεθος. Για να συνοψίσουμε είναι «μια συλλογή μοντέλων θεμελιωδών γλωσσών που κυμαίνονται από παραμέτρους 7Β έως 65Β».
- Η ιδέα πίσω από το LLaMA είναι ότι τα μικρότερα γλωσσικά μοντέλα θα μεγεθύνουν εξαιρετικά την ταχύτητα της έρευνας στην τεχνητή νοημοσύνη, καθώς μια μεγάλη κοινότητα δεν έχει πρόσβαση στην υποδομή που απαιτείται για τη μελέτη αυτών των μοντέλων.
- Αυτή η κυκλοφορία δεν δείχνει πραγματικά την πρόθεσή της να ανταγωνιστεί άλλα μοντέλα τεχνητής νοημοσύνης όπως το ChatGPT ή το Bard που έχουν την ικανότητα να επικοινωνούν.
Ο Meta έδωσε επίσης μια εξήγηση σε διαυγή μορφή γιατί επέλεξαν μικρότερα μοντέλα. Είναι επειδή είναι εύκολο να επανεκπαιδευτούν καθώς εκπαιδεύονται σε κομμάτια λέξεων ή σημείων. Προέβλεπε επίσης ότι τα υπομοντέλα LLaMA 65B και LLaMA 33B εκπαιδεύονται σε 1,4 τρισεκατομμύρια μάρκες, ενώ το μικρότερο μοντέλο LLaMA 7B είναι σε ένα τρισεκατομμύριο μάρκες.
Πρέπει να Διαβαστεί:Το YouChat 2.0 θα μπορούσε να ανταγωνιστεί το Google Bard και το ChatGPT
Αν και δεν θα είναι διαθέσιμο στο εμπόριο αυτή τη στιγμή για λόγους που αναφέρονται στο blog. «Για να διατηρήσουμε την ακεραιότητα και να αποτρέψουμε την κακή χρήση, κυκλοφορούμε το μοντέλο μας με μη εμπορική άδεια που επικεντρώνεται σε περιπτώσεις χρήσης έρευνας. Η πρόσβαση στο μοντέλο θα παρέχεται κατά περίπτωση σε ακαδημαϊκούς ερευνητές. όσοι συνδέονται με οργανώσεις στην κυβέρνηση, την κοινωνία των πολιτών και τον ακαδημαϊκό χώρο· και βιομηχανικά ερευνητικά εργαστήρια σε όλο τον κόσμο».
Σε Έργο Meta Research, η περίληψη ανέφερε ότι,«Συγκεκριμένα, το LLaMA-13B ξεπερνά το GPT-3 (175B) στα περισσότερα σημεία αναφοράς και το LLaMA-65B είναι ανταγωνιστικό με τα καλύτερα μοντέλα Chinchilla70B και PaLM-540B». Αυτά τα καλύτερα μοντέλα ανήκουν στην DeepMind και την Google αντίστοιχα. Επίσης, αποκάλυψε ότι η εταιρεία χρησιμοποιεί μόνο δημόσια διαθέσιμα δεδομένα που καθιστούν το μοντέλο συμβατό με το open-source. Αυτό είναι σε αντίθεση με τα μοντέλα τεχνητής νοημοσύνης όπως το DeepMind Chinchilla, το Google PaLM ή το OpenAI GPT-3 που χρησιμοποιούν μη τεκμηριωμένα ή δημόσια μη διαθέσιμα δεδομένα.
Συνιστάται:Πώς να ενσωματώσετε το ChatGPT στο Microsoft Word
Μετά την ένταξη του meta στον αγώνα τεχνητής νοημοσύνης και την κυκλοφορία μιας νέας γλώσσας, το Model LLaMA, ήταν σε αντίθεση με την κυκλοφορία του Google Bard με λίγο buzz. Αυτό δεν είναι κάτι κακό, καθώς δεν βιάζεται η απελευθέρωση που είχε ως αποτέλεσμα Το Google Bard δίνει λάθος απάντηση και πολλή κριτική. Αυτό είναι κάτι παρόμοιο με Bing Chatbot που αποκάλυψε πάρα πολλά σχετικά με το σύστημά του, όπως το πραγματικό του όνομα είναι Σίδνεϊ. Επίσης είχε ως αποτέλεσμα Η Microsoft περιορίζει τη συνομιλία Bing AI σε 5 απαντήσεις.
Η ανακοίνωση του LLaMA ήταν επίσης αρκετή με μια ανάρτηση στο Facebook και ένα μήνυμα στο Instagram από το Meta Channel. Δήλωσε», Σήμερα θα κυκλοφορήσουμε ένα νέο υπερσύγχρονο μοντέλο τεχνητής νοημοσύνης σε μεγάλη γλώσσα που ονομάζεται LLaMA που έχει σχεδιαστεί για να βοηθά τους ερευνητές να προωθήσουν το έργο τους. Τα LLM έχουν δείξει πολλά υποσχόμενα για τη δημιουργία κειμένου, τις συνομιλίες, τη σύνοψη γραπτού υλικού και πιο περίπλοκες εργασίες όπως η επίλυση μαθηματικών θεωρημάτων ή η πρόβλεψη δομών πρωτεΐνης. Η Meta έχει δεσμευτεί σε αυτό το ανοιχτό μοντέλο έρευνας και θα διαθέσουμε το νέο μας μοντέλο στην ερευνητική κοινότητα της τεχνητής νοημοσύνης». Ο Meta είναι επίσης ενθουσιασμένος για το πώς η κοινότητα θα μάθει και θα χτίσει χρησιμοποιώντας το LLaMA.
Μείνετε συντονισμένοι για περισσότερες ενημερώσεις σχετικά με την τεχνολογία και τις τελευταίες καινοτομίες στην τεχνητή νοημοσύνη στο TechCult!
Πηγή:Ιστολόγιο Meta AI