Meta présente des modèles d'IA vocale pour identifier plus de 4000 langues parlées
Divers / / May 23, 2023
Dans une annonce inédite, Méta, le géant de la technologie à l'origine de plates-formes et de technologies innovantes, a dévoilé une série de modèles d'intelligence (IA) qui ont le potentiel de révolutionner l'accessibilité des langues et préservation. Reconnaissant la disparition imminente de nombreuses langues et les limites de la reconnaissance vocale et de la technologie de génération existantes, le nouveau Modèles d'IA massivement multilingues (MMS) visent à surmonter les barrières linguistiques et à permettre aux individus d'accéder à l'information et d'interagir avec les appareils dans leurs langues préférées.
Table des matières
Identifiez plus de 4 000 langues parlées
Avec la technologie vocale actuelle couvrant environ 100 langues, les modèles MMS de Meta ont étendu cette gamme à un nombre étonnant
1 100 langues- une multiplication par dix. De plus, ces modèles d'IA avancés possèdent les capacité à identifier plus de 4 000 langues parlées, une amélioration incroyable de quarante fois. Les implications pour la communication interculturelle et l'inclusivité linguistique sont profondes.Interaction transparente dans la langue préférée
Des expériences de réalité virtuelle et augmentée aux services de messagerie, ces modèles d'IA peuvent désormais comprendre et interpréter les voix dans les langues préférées des gens, permettant une interaction fluide quelle que soit la diversité linguistique. La vision est de favoriser un monde où la langue n'est plus une barrière, et où chacun peut communiquer avec la technologie dans la langue qui lui convient le mieux.
Utilisation innovante des textes religieux
L'un des principaux défis auxquels Meta a dû faire face lors du développement de ces modèles était la rareté des données audio pour des milliers de langues. Les ensembles de données vocales traditionnels couvraient un maximum de 100 langues. D'un coup d'ingéniosité, Meta s'est tourné vers des textes religieux, comme la Bible, qui ont été largement traduits et étudiés.
Lectures du Nouveau Testament en 1 100 langues
Tirant parti des enregistrements audio accessibles au public de ces traductions, Meta a compilé un ensemble de données contenant des lectures du Nouveau Testament dans plus de 1 100 langues, fournissant une moyenne de 32 heures de données par langue.
La couverture linguistique s'étend à 4 000 langues
Pour étendre encore plus la couverture linguistique, Meta a incorporé des enregistrements non étiquetés de diverses lectures religieuses chrétiennes, propulsant le nombre de langues disponibles à plus de 4 000. Bien que le les données se composent principalement de locuteurs masculins et religieux, l'analyse de Meta assure que leur les modèles fonctionnent aussi bien pour les voix masculines que féminines. De plus, les modèles n'ont démontré aucun parti pris en faveur de la production d'un langage plus religieux, ce qui apaise les inquiétudes concernant tout biais potentiel dans la sortie.
Modèles Meta Open Sources et code pour la préservation de la langue
Fondamentalement, Meta a choisi de open source à la fois leurs modèles et leur code, permettant à d'autres chercheurs de s'appuyer sur leur travail et contribuer à la préservation et à l'accessibilité des langues dans le monde. Cette approche collaborative souligne l'engagement de Meta à unifier les efforts de préservation des langues et à rapprocher le monde.
De plus, l'introduction par Meta du modèle Massively Multilingual Speech AI s'aligne parfaitement sur le récent dévoilement d'un projet - le développement de leur première puce de silicium personnalisée exclusivement conçue pour les modèles d'IA. Cette avancée capitale fait partie intégrante de la stratégie globale de Meta visant à révolutionner son infrastructure d'IA, à accélérer la recherche sur l'IA et à façonner le métaverse émergent.
En affinant et en élargissant les capacités de ses modèles d'IA, Meta vise à éliminer les barrières linguistiques et à favoriser une communauté mondiale qui se nourrit de la diversité linguistique.
Source: Meta Newsroom
Alex Craig
Alex est animé par une passion pour la technologie et le contenu de jeu. Que ce soit en jouant aux derniers jeux vidéo, en se tenant au courant des dernières nouvelles technologiques ou en engageant avec d'autres personnes partageant les mêmes idées en ligne, l'amour d'Alex pour la technologie et les jeux est évident dans tout ce qu'il fait.
Alex est animé par une passion pour la technologie et le contenu de jeu. Que ce soit en jouant aux derniers jeux vidéo, en se tenant au courant des dernières nouvelles technologiques ou en engageant avec d'autres personnes partageant les mêmes idées en ligne, l'amour d'Alex pour la technologie et les jeux est évident dans tout ce qu'il fait.