Meta introduceert spraak-AI-modellen om meer dan 4000 gesproken talen te identificeren – TechCult
Diversen / / May 23, 2023
In een baanbrekende aankondiging, Meta, de techgigant achter innovatieve platforms en technologieën, onthulde een reeks kunstmatige intelligentie (AI) modellen die het potentieel hebben om een revolutie teweeg te brengen in taaltoegankelijkheid en behoud. Gezien de aanstaande verdwijning van talloze talen en de beperkingen van bestaande spraakherkennings- en generatietechnologie, heeft Meta's nieuwe Massively Multilingual Speech (MMS) AI-modellen doel om taalbarrières te overbruggen en individuen in staat te stellen toegang te krijgen tot informatie en te communiceren met apparaten in hun voorkeurstaal.
Inhoudsopgave
Identificeer meer dan 4.000 gesproken talen
Met de huidige spraaktechnologie die ongeveer 100 talen bestrijkt, hebben Meta's MMS-modellen dit bereik uitgebreid tot een verbazingwekkende
1.100 talen— een vertienvoudiging. Bovendien beschikken deze geavanceerde AI-modellen over de vermogen om meer dan 4.000 gesproken talen te identificeren, een ongelooflijke veertigvoudige verbetering. De implicaties voor interculturele communicatie en taalkundige inclusiviteit zijn ingrijpend.Naadloze interactie in de voorkeurstaal
Van virtual en augmented reality-ervaringen tot berichtenservices, deze AI-modellen kunnen nu stemmen begrijpen en interpreteren in de voorkeurstaal van mensen, naadloze interactie mogelijk maken, ongeacht taalkundige diversiteit. De visie is om een wereld te bevorderen waar taal is geen barrière meer, en waar iedereen met technologie kan communiceren in een taal die voor hen het prettigst aanvoelt.
Innovatief gebruik van religieuze teksten
Een van de belangrijkste uitdagingen waarmee Meta werd geconfronteerd bij het ontwikkelen van deze modellen, was de schaarste aan audiogegevens voor duizenden talen. Traditionele spraakdatasets dekten maximaal 100 talen. In een vleugje vindingrijkheid, Meta wendde zich tot religieuze teksten, zoals de Bijbel, die uitgebreid zijn vertaald en bestudeerd.
Lezingen van het Nieuwe Testament in 1100 talen
Gebruikmakend van de openbaar beschikbare audio-opnamen van deze vertalingen, stelde Meta een dataset samen met lezingen van het Nieuwe Testament in meer dan 1.100 talen, gemiddeld 32 uur aan data per taal leveren.
Taaldekking strekt zich uit tot 4.000 talen
Om de taaldekking nog verder uit te breiden, nam Meta niet-gelabelde opnames op van verschillende christelijke religieuze lezingen, waardoor het aantal beschikbare talen op meer dan 4.000 kwam. Hoewel de data bestaat voornamelijk uit mannelijke sprekers en religieuze inhoud, verzekert Meta's analyse dat hun modellen presteren even goed voor zowel mannelijke als vrouwelijke stemmen. Bovendien hebben de modellen geen voorkeur getoond voor het produceren van meer religieuze taal, waardoor de bezorgdheid over mogelijke scheefheid in de uitvoer wordt weggenomen.
Meta Open-Sources-modellen en code voor taalbehoud
Cruciaal is dat Meta ervoor heeft gekozen open-source zowel hun modellen als code, waardoor andere onderzoekers dat ook kunnen voortbouwen op hun werk en bijdragen aan het behoud en de toegankelijkheid van talen wereldwijd. Deze samenwerkingsaanpak benadrukt Meta's toewijding om de inspanningen op het gebied van taalbehoud te bundelen en de wereld dichter bij elkaar te brengen.
Bovendien sluit Meta's introductie van het Massively Multilingual Speech AI-model naadloos aan bij hun recente onthulling van een project: de ontwikkeling van hun eerste op maat gemaakte siliciumchip, exclusief vervaardigd voor AI-modellen. Deze gedenkwaardige vooruitgang is een integraal onderdeel van Meta's overkoepelende strategie om een revolutie teweeg te brengen in de AI-infrastructuur, AI-onderzoek te versnellen en vorm te geven aan de opkomende metaverse.
Door de mogelijkheden van zijn AI-modellen te verfijnen en uit te breiden, wil Meta taalbarrières slechten en een wereldwijde gemeenschap bevorderen die gedijt op taaldiversiteit.
Bron: Meta Newsroom
Alex Craig
Alex wordt gedreven door een passie voor technologie en gamingcontent. Of het nu is door de nieuwste videogames te spelen, op de hoogte te blijven van het laatste technische nieuws of boeiend te zijn met andere gelijkgestemde individuen online, komt Alex' liefde voor technologie en gaming duidelijk naar voren in alles wat hij doet doet.
Alex wordt gedreven door een passie voor technologie en gamingcontent. Of het nu is door de nieuwste videogames te spelen, op de hoogte te blijven van het laatste technische nieuws of boeiend te zijn met andere gelijkgestemde individuen online, komt Alex' liefde voor technologie en gaming duidelijk naar voren in alles wat hij doet doet.