Meta představuje modely Speech AI pro identifikaci více než 4000 mluvených jazyků – TechCult
Různé / / May 23, 2023
V průlomovém oznámení, Meta, technologický gigant stojící za inovativními platformami a technologiemi, odhalil řadu umělých modely inteligence (AI), které mají potenciál způsobit revoluci v jazykové dostupnosti a zachování. Meta's si uvědomuje bezprostřední vymizení mnoha jazyků a omezení stávající technologie rozpoznávání a generování řeči. Masivně vícejazyčné modely AI (MMS). Cílem je překonat jazykové bariéry a umožnit jednotlivcům přístup k informacím a interakci se zařízeními v jejich preferovaných jazycích.
Obsah
Rozpoznejte více než 4 000 mluvených jazyků
Se současnou technologií řeči, která pokrývá přibližně 100 jazyků, modely MMS společnosti Meta rozšířily tuto řadu na ohromující 1100 jazyků- desetinásobný nárůst. Tyto pokročilé modely umělé inteligence navíc disponují
schopnost identifikovat více než 4000 mluvených jazyků, neuvěřitelné čtyřicetinásobné zlepšení. Důsledky pro mezikulturní komunikaci a jazykovou inkluzivitu jsou hluboké.Bezproblémová interakce v preferovaném jazyce
Od zkušeností s virtuální a rozšířenou realitou až po služby zasílání zpráv, tyto modely umělé inteligence nyní dokážou porozumět a interpretovat hlasy v preferovaných jazycích lidí, umožňující bezproblémovou interakci bez ohledu na jazykovou rozmanitost. Vizí je podporovat svět, kde jazyk již není překážkoua kde každý může komunikovat s technologiemi v jazyce, který je pro něj nejpohodlnější.
Inovativní využití náboženských textů
Jedním z hlavních problémů, kterým Meta při vývoji těchto modelů čelila, byl nedostatek zvukových dat pro tisíce jazyků. Tradiční datové sady řeči pokrývaly maximálně 100 jazyků. V nádechu vynalézavosti, Meta se obrátila na náboženské texty, jako je Bible, které byly rozsáhle překládány a studovány.
Čtení Nového zákona v 1100 jazycích
S využitím veřejně dostupných zvukových nahrávek těchto překladů sestavil Meta soubor dat obsahující čtení Nového zákona ve více než 1100 jazycích, poskytuje průměrně 32 hodin dat na jazyk.
Jazykové pokrytí se rozšiřuje na 4 000 jazyků
Aby se jazykové pokrytí ještě více rozšířilo, Meta začlenila neoznačené nahrávky různých křesťanských náboženských čtení, čímž se počet dostupných jazyků zvýšil na více než 4 000. Ačkoliv data sestávají především z mužských mluvčích a náboženský obsah, analýza Meta zajišťuje, že jejich modely fungují stejně dobře pro mužské i ženské hlasy. Modely navíc neprokázaly žádnou zaujatost vůči produkování více náboženských jazyků, což zmírnilo obavy ohledně případného zkreslení výstupu.
Meta modely s otevřenými zdroji a kód pro uchování jazyka
Rozhodující je, že se Meta rozhodla open-source jak jejich modely, tak kód, což umožňuje dalším výzkumníkům stavět na jejich práci a přispívat k ochraně a dostupnosti jazyků po celém světě. Tento přístup založený na spolupráci zdůrazňuje odhodlání společnosti Meta sjednotit úsilí o zachování jazyka a sblížení světa.
Kromě toho představení modelu Massively Multilingual Speech AI společností Meta hladce zapadá do jejich nedávného odhalení projektu – vývoj jejich prvního vlastního křemíkového čipu výhradně vytvořeného pro modely AI. Tento významný pokrok je nedílnou součástí zastřešující strategie společnosti Meta, která má změnit infrastrukturu AI, urychlit výzkum AI a utvářet vznikající metaverze.
Zdokonalováním a rozšiřováním možností svých modelů AI se Meta snaží prolomit jazykové bariéry a podporovat globální komunitu, která prosperuje z jazykové rozmanitosti.
Zdroj: Meta Newsroom
Alex Craig
Alex je poháněn vášní pro technologie a herní obsah. Ať už je to hraním nejnovějších videoher, sledováním nejnovějších technologických novinek nebo zapojením s ostatními stejně smýšlejícími jedinci online je Alexova láska k technologiím a hrám evidentní ve všem, co on dělá.
Alex je poháněn vášní pro technologie a herní obsah. Ať už je to hraním nejnovějších videoher, sledováním nejnovějších technologických novinek nebo zapojením s ostatními stejně smýšlejícími jedinci online je Alexova láska k technologiím a hrám evidentní ve všem, co on dělá.