Meta presenta modelli di intelligenza artificiale vocale per identificare oltre 4000 lingue parlate – TechCult
Varie / / May 23, 2023
In un annuncio rivoluzionario, Meta, il gigante tecnologico dietro piattaforme e tecnologie innovative, ha svelato una serie di artificiali modelli di intelligenza (AI) che hanno il potenziale per rivoluzionare l'accessibilità linguistica e preservazione. Riconoscendo l'imminente scomparsa di numerose lingue e i limiti del riconoscimento vocale esistente e della tecnologia di generazione, Meta's new Modelli di IA Massively Multilingual Speech (MMS). mirano a superare le barriere linguistiche e consentire alle persone di accedere alle informazioni e interagire con i dispositivi nelle loro lingue preferite.
Sommario
Identifica oltre 4.000 lingue parlate
Con l'attuale tecnologia vocale che copre circa 100 lingue, i modelli MMS di Meta hanno ampliato questa gamma in modo sorprendente
1.100 lingue- un aumento di dieci volte. Inoltre, questi modelli di intelligenza artificiale avanzati possiedono il capacità di identificare oltre 4.000 lingue parlate, un incredibile miglioramento di quaranta volte. Le implicazioni per la comunicazione interculturale e l'inclusività linguistica sono profonde.Interazione continua nella lingua preferita
Dalle esperienze di realtà virtuale e aumentata ai servizi di messaggistica, questi modelli di intelligenza artificiale possono ora comprendere e interpretare le voci nelle lingue preferite dalle persone, consentendo un'interazione continua indipendentemente dalla diversità linguistica. La visione è quella di promuovere un mondo in cui la lingua non è più una barriera, e dove tutti possono comunicare con la tecnologia in un linguaggio a loro più comodo.
Uso innovativo di testi religiosi
Una delle sfide principali che Meta ha affrontato nello sviluppo di questi modelli è stata la scarsità di dati audio per migliaia di lingue. I set di dati vocali tradizionali coprivano un massimo di 100 lingue. In un colpo di ingegno, Meta si è rivolto a testi religiosi, come la Bibbia, che sono stati ampiamente tradotti e studiati.
Letture del Nuovo Testamento in 1.100 lingue
Sfruttando le registrazioni audio pubblicamente disponibili di queste traduzioni, Meta ha compilato un set di dati con letture del Nuovo Testamento in oltre 1.100 lingue, fornendo una media di 32 ore di dati per lingua.
La copertura linguistica si estende a 4.000 lingue
Per espandere ulteriormente la copertura linguistica, Meta ha incorporato registrazioni non etichettate di varie letture religiose cristiane, spingendo il numero di lingue disponibili a oltre 4.000. sebbene il i dati consistono principalmente di parlanti maschi e contenuto religioso, l'analisi di Meta assicura che il loro i modelli si comportano ugualmente bene sia per le voci maschili che per quelle femminili. Inoltre, i modelli non hanno dimostrato alcun pregiudizio verso la produzione di un linguaggio più religioso, placando le preoccupazioni riguardo a qualsiasi potenziale distorsione nell'output.
Meta modelli open-source e codice per la conservazione del linguaggio
Fondamentalmente, Meta ha scelto di farlo rendere open-source sia i modelli che il codice, consentendo ad altri ricercatori di costruire sul loro lavoro e contribuire alla conservazione e all'accessibilità delle lingue in tutto il mondo. Questo approccio collaborativo sottolinea l'impegno di Meta nell'unificare gli sforzi nella conservazione della lingua e nell'avvicinare il mondo.
Inoltre, l'introduzione da parte di Meta del modello Massively Multilingual Speech AI si allinea perfettamente con la loro recente presentazione di un progetto: il sviluppo del loro primo chip di silicio personalizzato realizzato esclusivamente per i modelli AI. Questo importante progresso è parte integrante della strategia generale di Meta per rivoluzionare la sua infrastruttura AI, accelerare la ricerca sull'IA e dare forma al metaverso emergente.
Perfezionando ed espandendo le capacità dei suoi modelli di intelligenza artificiale, Meta mira ad abbattere le barriere linguistiche e promuovere una comunità globale che prospera sulla diversità linguistica.
Fonte: Meta redazione
Alex Craig
Alex è guidato dalla passione per la tecnologia e i contenuti di gioco. Che si tratti di giocare agli ultimi videogiochi, tenersi al passo con le ultime notizie tecnologiche o coinvolgere con altre persone che la pensano allo stesso modo online, l'amore di Alex per la tecnologia e il gioco è evidente in tutto ciò che lui fa.
Alex è guidato dalla passione per la tecnologia e i contenuti di gioco. Che si tratti di giocare agli ultimi videogiochi, tenersi al passo con le ultime notizie tecnologiche o coinvolgere con altre persone che la pensano allo stesso modo online, l'amore di Alex per la tecnologia e il gioco è evidente in tutto ciò che lui fa.