Meta introducerar Voicebox ett mångsidigt verktyg för AI för talgenerering – TechCult
Miscellanea / / June 17, 2023
Meta introducerar ett genombrott inom generativ AI och teknik för att generera tal till text med ett mångsidigt verktyg Röstlåda. Den nya AI-modellen kan utföra uppgifter som redigering, sampling och stilisering.
Möjligheten att generera förstklassiga ljudklipp och modifiera förinspelat ljud är en anmärkningsvärd egenskap hos Voicebox. Det kan effektivt eliminera störande ljud som biltutor eller skällande hundar samtidigt som den ursprungliga essensen och tonen i ljudet bibehålls. Dessutom är denna modell skicklig på flera språk, vilket gör att den kan leverera tal på sex olika språk med samma kunskaper.
generativa AI-modeller som Voicebox har potentialen att ge verklighetstrogna röster till virtuella assistenter och icke-spelare i metaversen. Företaget delade sin vision i en blogg som det delade och tillkännagav det nya verktyget som säger, "I framtiden kan multifunktionella generativa AI-modeller som Voicebox ge naturligt klingande röster till virtuella assistenter och icke-spelare-karaktärer i metaversen. De kan tillåta synskadade personer att höra skrivna meddelanden från vänner som läses av AI i deras röster, ge kreatörer nya verktyg för att enkelt skapa och redigera ljudspår för videor och mycket mer.”
Det nya verktyget från Meta kan utföra följande uppgifter åt dig:
- Text-till-tal-syntes i sammanhang: Voicebox har den anmärkningsvärda förmågan att analysera och replikera ljudproverna, även när provet är så litet som två sekunder. Detta innebär att Voicebox effektivt kan använda den identifierade ljudstilen för att generera text till tal resultat som ligger nära önskat ljud och ton.
- Talredigering och brusreducering: Voicebox kan rekonstruera sektioner av tal som har störts av brus eller ändra felaktiga ord, allt utan att det krävs en fullständig ominspelning av hela talet. Detta möjliggör effektiva och exakta korrigeringar, vilket sparar tid och ansträngning i processen.
- Tvärspråkig stilöverföring: Voicebox visar upp sin anmärkningsvärda mångsidighet genom att enkelt anpassa sig till olika språk. Genom att använda ett talexempel och ett textstycke på engelska, franska, tyska, spanska, polska eller portugisiska kan verktyget generera en ljudläsning av texten på vilket som helst av dessa språk.
- Olika talprover: Tack vare omfattande exponering för olika datauppsättningar har Voicebox skaffat sig förmågan att generera tal som nära emulerar naturliga samtalsmönster som finns i verkliga interaktioner.
Som generativ AI-teknik fortsätter att utvecklas, många företag tar med nya och förbättrade verktyg för att ge bättre upplevelser till användarna. Nu när Meta introducerar Voicebox-talgenerationens AI-verktyg, hoppas företaget att dess mångsidiga funktioner gör det möjligt för det att bli en språngbräda i den revolutionerande tekniken.
Källa: Meta Newsroom
Alex Craig
Alex drivs av en passion för teknik och spelinnehåll. Oavsett om det är genom att spela de senaste videospelen, hänga med i de senaste tekniska nyheterna eller engagera dig med andra likasinnade online, Alex kärlek till teknik och spel är tydlig i allt han gör.
Alex drivs av en passion för teknik och spelinnehåll. Oavsett om det är genom att spela de senaste videospelen, hänga med i de senaste tekniska nyheterna eller engagera dig med andra likasinnade online, Alex kärlek till teknik och spel är tydlig i allt han gör.