Meta présente Voicebox, une IA polyvalente pour l'outil de génération de parole - TechCult
Divers / / June 17, 2023
Méta présente une percée dans l'IA générative et la technologie de génération de parole en texte avec un outil polyvalent Boîte vocale. Le nouveau modèle d'IA peut effectuer des tâches telles que l'édition, l'échantillonnage et la stylisation.
La possibilité de générer des clips audio de premier ordre et de modifier l'audio préenregistré est une caractéristique notable de Voicebox. Il peut éliminer efficacement les sons perturbateurs tels que les klaxons de voiture ou les aboiements de chiens tout en conservant l'essence et le ton d'origine de l'audio. De plus, ce modèle maîtrise plusieurs langues, ce qui lui permet de prononcer la parole dans six langues différentes avec une compétence égale.
modèles d'IA génératifs comme Voicebox ont le potentiel de fournir des voix réalistes aux assistants virtuels et aux personnages non joueurs dans le métaverse. L'entreprise a partagé sa vision dans un blog qu'elle a partagé annonçant le nouvel outil en déclarant, « À l'avenir, des modèles d'IA génératifs polyvalents comme Voicebox pourraient donner des voix au son naturel aux assistants virtuels et aux personnages non-joueurs dans le métaverse. Ils pourraient permettre aux personnes malvoyantes d'entendre les messages écrits d'amis lus par l'IA dans leur voix, donner aux créateurs de nouveaux outils pour créer et éditer facilement des pistes audio pour les vidéos, et bien plus encore.
Le nouvel outil de Meta peut effectuer pour vous les tâches suivantes :
- Synthèse texte-parole en contexte: Voicebox a la capacité remarquable d'analyser et de répliquer les échantillons audio, même lorsque l'échantillon est aussi petit que deux secondes. Cela signifie que Voicebox peut utiliser efficacement le style audio identifié pour générer texte pour parler des résultats qui correspondent étroitement au son et à la tonalité souhaités.
- Édition de la parole et réduction du bruit: Voicebox peut reconstruire des sections de discours qui ont été perturbées par du bruit ou modifier des mots mal prononcés, le tout sans nécessiter un réenregistrement complet de l'intégralité du discours. Cela permet d'effectuer des corrections efficaces et précises, ce qui permet d'économiser du temps et des efforts dans le processus.
- Transfert de style interlinguistique: Voicebox met en valeur sa polyvalence remarquable en s'adaptant facilement à différentes langues. En utilisant un échantillon de parole et un passage de texte en anglais, français, allemand, espagnol, polonais ou portugais, l'outil peut générer une lecture audio du texte dans l'une de ces langues.
- Échantillonnage vocal varié: Grâce à une exposition étendue à divers ensembles de données, Voicebox a acquis la capacité de générer un discours qui émule étroitement les modèles de conversation naturels trouvés dans les interactions du monde réel.
Comme technologie IA générative continue de progresser, de nombreuses entreprises proposent des outils nouveaux et améliorés pour offrir de meilleures expériences aux utilisateurs. Maintenant que Meta présente l'outil d'intelligence artificielle de génération vocale Voicebox, la société espère que ses fonctionnalités polyvalentes lui permettront de devenir un tremplin dans cette technologie révolutionnaire.
Source: Meta Newsroom
Alex Craig
Alex est animé par une passion pour la technologie et le contenu de jeu. Que ce soit en jouant aux derniers jeux vidéo, en se tenant au courant des dernières nouvelles technologiques ou en engageant avec d'autres personnes partageant les mêmes idées en ligne, l'amour d'Alex pour la technologie et les jeux est évident dans tout ce qu'il fait.
Alex est animé par une passion pour la technologie et le contenu de jeu. Que ce soit en jouant aux derniers jeux vidéo, en se tenant au courant des dernières nouvelles technologiques ou en engageant avec d'autres personnes partageant les mêmes idées en ligne, l'amour d'Alex pour la technologie et les jeux est évident dans tout ce qu'il fait.