Meta introducerer Voicebox, et alsidigt AI til talegenereringsværktøj – TechCult
Miscellanea / / June 17, 2023
Meta introducerer et gennembrud inden for generativ AI og tale-til-tekst-genereringsteknologi med et alsidigt værktøj Stemme kasse. Den nye AI-model kan udføre opgaver som redigering, prøveudtagning og stilisering.
Evnen til at generere førsteklasses lydklip og ændre forudindspillet lyd er en bemærkelsesværdig funktion ved Voicebox. Det kan effektivt eliminere forstyrrende lyde såsom bilhorn eller gøende hunde, mens den bibeholder den originale essens og tone i lyden. Desuden er denne model dygtig til flere sprog, hvilket gør den i stand til at levere tale på seks forskellige sprog med samme dygtighed.
generative AI-modeller som Voicebox har potentialet til at give virkelighedstro stemmer til virtuelle assistenter og ikke-spillerfigurer i metaverset. Virksomheden delte sin vision i en blog, som den delte, der annoncerede det nye værktøj, hvori "I fremtiden kan multifunktionelle generative AI-modeller som Voicebox give naturligt klingende stemmer til virtuelle assistenter og ikke-spiller-karakterer i metaverset. De kunne tillade synshandicappede mennesker at høre skrevne beskeder fra venner læst af AI i deres stemmer, give skabere nye værktøjer til nemt at oprette og redigere lydspor til videoer og meget mere."
Det nye værktøj fra Meta kan udføre følgende opgaver for dig:
- Tekst-til-tale-syntese i kontekst: Voicebox har den bemærkelsesværdige evne til at analysere og replikere lydprøverne, selv når prøven er så lille som to sekunder. Dette betyder, at Voicebox effektivt kan anvende den identificerede lydstil til at generere tekst til tale resultater, der stemmer nøje overens med den ønskede lyd og tone.
- Taleredigering og støjreduktion: Voicebox kan rekonstruere dele af tale, der er blevet forstyrret af støj, eller ændre forkert talte ord, alt sammen uden at kræve en fuldstændig genoptagelse af hele talen. Dette giver mulighed for at foretage effektive og præcise rettelser, hvilket sparer tid og kræfter i processen.
- Tværsproget stiloverførsel: Voicebox viser sin bemærkelsesværdige alsidighed ved let at tilpasse sig forskellige sprog. Ved at bruge en taleprøve og en tekstpassage på engelsk, fransk, tysk, spansk, polsk eller portugisisk kan værktøjet generere en lydlæsning af teksten på et hvilket som helst af disse sprog.
- Diverse taleprøver: Takket være omfattende eksponering for forskellige datasæt, har Voicebox erhvervet evnen til at generere tale, der tæt emulerer naturlige samtalemønstre, der findes i virkelige interaktioner.
Som generativ AI-teknologi fortsætter med at udvikle sig, mange virksomheder bringer nye og forbedrede værktøjer til at give bedre oplevelser til brugerne. Nu hvor Meta introducerer Voicebox-talegenerations AI-værktøjet, håber virksomheden, at dets alsidige funktioner vil gøre det muligt for det at blive et springbræt i den revolutionerende teknologi.
Kilde: Meta Newsroom
Alex Craig
Alex er drevet af en passion for teknologi og spilindhold. Uanset om det er ved at spille de seneste videospil, holde sig ajour med de seneste tekniske nyheder eller engagere med andre ligesindede online, Alex' kærlighed til teknologi og spil er tydelig i alt det, han gør.
Alex er drevet af en passion for teknologi og spilindhold. Uanset om det er ved at spille de seneste videospil, holde sig ajour med de seneste tekniske nyheder eller engagere med andre ligesindede online, Alex' kærlighed til teknologi og spil er tydelig i alt det, han gør.