Meta presenta Voicebox, una IA versátil para la herramienta de generación de voz – TechCult
Miscelánea / / June 17, 2023
Meta presenta un avance en la IA generativa y la tecnología de generación de voz a texto con una herramienta versátil Caja de voz. El nuevo modelo de IA puede realizar tareas como editar, muestrear y estilizar.
La capacidad de generar clips de audio de primer nivel y modificar el audio pregrabado es una característica notable de Voicebox. Puede eliminar de forma eficaz los sonidos molestos, como las bocinas de los coches o los ladridos de perros, manteniendo la esencia y el tono originales del audio. Además, este modelo es competente en varios idiomas, lo que le permite hablar en seis idiomas diferentes con la misma competencia.
modelos generativos de IA como Voicebox tienen el potencial de proporcionar voces realistas a asistentes virtuales y personajes que no son jugadores dentro del metaverso. La compañía compartió su visión en un blog que compartió anunciando la nueva herramienta que decía: “En el futuro, los modelos de IA generativa multipropósito como Voicebox podrían brindar voces de sonido natural a los asistentes virtuales y personajes que no son jugadores en el metaverso. Podrían permitir que las personas con discapacidades visuales escuchen mensajes escritos de amigos leídos por IA en sus voces, dar a los creadores nuevas herramientas para crear y editar fácilmente pistas de audio para videos y mucho más”.
La nueva herramienta de Meta puede realizar las siguientes tareas por usted:
- Síntesis de texto a voz en contexto: Voicebox tiene la notable capacidad de analizar y replicar las muestras de audio, incluso cuando la muestra es tan pequeña como dos segundos. Esto significa que Voicebox puede emplear efectivamente el estilo de audio identificado para generar texto a voz resultados que se alinean estrechamente con el sonido y el tono deseados.
- Edición de voz y reducción de ruido: Voicebox puede reconstruir secciones del discurso que han sido interrumpidas por el ruido o cambiar las palabras mal pronunciadas, todo sin necesidad de volver a grabar todo el discurso. Esto permite realizar correcciones eficientes y precisas, ahorrando tiempo y esfuerzo en el proceso.
- Transferencia de estilo entre idiomas: Voicebox muestra su notable versatilidad al adaptarse fácilmente a varios idiomas. Al utilizar una muestra de voz y un pasaje de texto en inglés, francés, alemán, español, polaco o portugués, la herramienta puede generar una lectura de audio del texto en cualquiera de estos idiomas.
- Muestreo de voz diversa: Gracias a la amplia exposición a diversos conjuntos de datos, Voicebox ha adquirido la capacidad de generar un discurso que emula de cerca los patrones de conversación naturales que se encuentran en las interacciones del mundo real.
Como tecnología de IA generativa continúa progresando, muchas corporaciones están trayendo herramientas nuevas y mejoradas para brindar mejores experiencias a los usuarios. Ahora que Meta presenta la herramienta de IA de generación de voz Voicebox, la compañía espera que sus características versátiles le permitan convertirse en un trampolín en la tecnología revolucionaria.
Fuente: Meta Sala de redacción
alex craig
Alex está motivado por la pasión por la tecnología y el contenido de juegos. Ya sea jugando los últimos videojuegos, manteniéndose al día con las últimas noticias tecnológicas o participando con otras personas de ideas afines en línea, el amor de Alex por la tecnología y los juegos es evidente en todo lo que él hace.
Alex está motivado por la pasión por la tecnología y el contenido de juegos. Ya sea jugando los últimos videojuegos, manteniéndose al día con las últimas noticias tecnológicas o participando con otras personas de ideas afines en línea, el amor de Alex por la tecnología y los juegos es evidente en todo lo que él hace.