Meta wprowadza modele sztucznej inteligencji mowy w celu identyfikacji ponad 4000 języków mówionych – TechCult
Różne / / May 23, 2023
W przełomowym ogłoszeniu Meta, technologiczny gigant stojący za innowacyjnymi platformami i technologiami, zaprezentował serię sztucznych modele inteligencji (AI), które mogą zrewolucjonizować dostępność języka i ochrona. Uznając rychłe zniknięcie wielu języków i ograniczenia istniejącej technologii rozpoznawania i generowania mowy, nowy Masowo wielojęzyczne modele mowy (MMS) AI mają na celu pokonywanie barier językowych i umożliwianie jednostkom dostępu do informacji i interakcji z urządzeniami w preferowanych przez nich językach.
Spis treści
Zidentyfikuj ponad 4000 języków mówionych
Przy obecnej technologii mowy obejmującej około 100 języków, modele MMS firmy Meta rozszerzyły ten zakres do zdumiewającego poziomu 1100 języków— dziesięciokrotny wzrost. Co więcej, te zaawansowane modele AI posiadają
zdolność rozpoznawania ponad 4000 języków mówionych, niewiarygodna czterdziestokrotna poprawa. Implikacje dla komunikacji międzykulturowej i integracji językowej są głębokie.Bezproblemowa interakcja w preferowanym języku
Od doświadczeń wirtualnej i rozszerzonej rzeczywistości po usługi przesyłania wiadomości, te modele sztucznej inteligencji mogą teraz rozumieć i interpretować głosy w preferowanych przez ludzi językach, umożliwiając bezproblemową interakcję niezależnie od różnorodności językowej. Wizją jest wspieranie świata, w którym język nie jest już barierą, gdzie każdy może komunikować się z technologią w języku, który jest dla niego najwygodniejszy.
Innowacyjne wykorzystanie tekstów religijnych
Jednym z głównych wyzwań, przed którymi stanęła Meta podczas opracowywania tych modeli, był niedobór danych dźwiękowych dla tysięcy języków. Tradycyjne zbiory danych mowy obejmowały maksymalnie 100 języków. W przypływie pomysłowości, Meta zwróciła się ku tekstom religijnym, takim jak Biblia, które były szeroko tłumaczone i studiowane.
Czytania Nowego Testamentu w 1100 językach
Wykorzystując publicznie dostępne nagrania dźwiękowe tych tłumaczeń, Meta skompilowała zbiór danych obejmujący odczyty Nowego Testamentu w ponad 1100 językach, zapewniając średnio 32 godziny danych na język.
Zakres językowy obejmuje 4000 języków
Aby jeszcze bardziej rozszerzyć zasięg językowy, Meta włączyła nieoznaczone nagrania różnych chrześcijańskich czytań religijnych, zwiększając liczbę dostępnych języków do ponad 4000. Chociaż dane składają się głównie z mówców płci męskiej i treści religijnych, analiza Meta zapewnia, że ich modele sprawdzają się równie dobrze zarówno w przypadku głosów męskich, jak i żeńskich. Ponadto modele nie wykazały tendencji do tworzenia bardziej religijnego języka, co rozwiało obawy dotyczące potencjalnego zniekształcenia wyników.
Meta Modele Open-Source i kod do zachowania języka
Co najważniejsze, Meta zdecydowała się na to open-source zarówno ich modele, jak i kod, umożliwiając innym badaczom opierać się na ich pracy i przyczyniać się do zachowania i udostępniania języków na całym świecie. To oparte na współpracy podejście podkreśla zaangażowanie Meta w jednoczenie wysiłków na rzecz zachowania języka i zbliżania świata.
Co więcej, wprowadzenie przez Meta modelu Massively Multilingual Speech AI bezproblemowo współgra z niedawnym ujawnieniem projektu — opracowanie ich pierwszego niestandardowego chipa krzemowego stworzonego wyłącznie dla modeli AI. Ten przełomowy postęp jest integralną częścią nadrzędnej strategii Meta, której celem jest zrewolucjonizowanie infrastruktury sztucznej inteligencji, przyspieszenie badań nad sztuczną inteligencją i kształtowanie powstającego metawszechświata.
Udoskonalając i rozszerzając możliwości swoich modeli sztucznej inteligencji, Meta dąży do przełamania barier językowych i wspierania globalnej społeczności, która rozwija się dzięki różnorodności językowej.
Źródło: Newsroom Meta
Alexa Craiga
Alex jest napędzany pasją do technologii i gier. Niezależnie od tego, czy chodzi o granie w najnowsze gry wideo, nadążanie za najnowszymi wiadomościami technicznymi czy wciąganie z innymi podobnie myślącymi osobami online, miłość Alexa do technologii i gier jest widoczna we wszystkim, co robi robi.
Alex jest napędzany pasją do technologii i gier. Niezależnie od tego, czy chodzi o granie w najnowsze gry wideo, nadążanie za najnowszymi wiadomościami technicznymi czy wciąganie z innymi podobnie myślącymi osobami online, miłość Alexa do technologii i gier jest widoczna we wszystkim, co robi robi.