Meta představuje Voicebox, všestrannou umělou inteligenci pro generování řeči – TechCult
Různé / / June 17, 2023
Meta představuje průlom v generativní umělé inteligenci a technologii generování řeči na text s všestranným nástrojem Hlasová schránka. Nový model umělé inteligence může provádět úkoly, jako jsou úpravy, vzorkování a stylizace.
Schopnost generovat špičkové zvukové klipy a upravovat předem nahraný zvuk je pozoruhodnou funkcí Voiceboxu. Dokáže efektivně eliminovat rušivé zvuky, jako jsou klaksony auta nebo štěkot psů, při zachování původní podstaty a tónu zvuku. Navíc tento model ovládá více jazyků, což mu umožňuje přednášet řeč v šesti různých jazycích se stejnou odborností.
generativní modely AI jako Voicebox mají potenciál poskytovat realistické hlasy virtuálním asistentům a nehráčským postavám v rámci metaverze. Společnost sdílela svou vizi na blogu, který sdílela a oznámila nový nástroj a uvedla: „V budoucnu by víceúčelové generativní modely umělé inteligence, jako je Voicebox, mohly poskytnout přirozeně znějící hlasy virtuálním asistentům a nehráčským postavám v metavesmíru. Mohly by umožnit lidem se zrakovým postižením slyšet psané zprávy od přátel čtené AI v jejich hlasech, dát tvůrcům nové nástroje pro snadné vytváření a úpravu zvukových stop pro videa a mnoho dalšího.“
Nový nástroj od Meta za vás může provádět následující úkoly:
- Kontextová syntéza textu na řeč: Voicebox má pozoruhodnou schopnost analyzovat a replikovat zvukové vzorky, i když je vzorek malý jako dvě sekundy. To znamená, že Voicebox může efektivně využívat identifikovaný styl zvuku k generování text na řeč výsledky, které přesně odpovídají požadovanému zvuku a tónu.
- Úprava řeči a redukce šumu: Voicebox dokáže rekonstruovat úseky řeči, které byly narušeny hlukem nebo změnit chybně vyslovená slova, a to vše bez nutnosti kompletního opětovného nahrávání celé řeči. To umožňuje provádět účinné a přesné opravy, což šetří čas a úsilí v procesu.
- Přenos stylu mezi jazyky: Voicebox předvádí svou pozoruhodnou všestrannost tím, že se snadno přizpůsobí různým jazykům. Využitím ukázky řeči a textové pasáže v angličtině, francouzštině, němčině, španělštině, polštině nebo portugalštině může nástroj generovat zvukové čtení textu v kterémkoli z těchto jazyků.
- Různé vzorky řeči: Díky rozsáhlému vystavení různým datovým sadám získal Voicebox schopnost generovat řeč, která úzce napodobuje přirozené konverzační vzorce nalezené v interakcích v reálném světě.
Tak jako generativní technologie AI pokračuje v pokroku, mnoho společností přináší nové a vylepšené nástroje, které uživatelům poskytují lepší zkušenosti. Nyní, když Meta představuje nástroj AI pro generování řeči Voicebox, společnost doufá, že jeho všestranné funkce mu umožní stát se odrazovým můstkem v revoluční technologii.
Zdroj: Meta Newsroom
Alex Craig
Alex je poháněn vášní pro technologie a herní obsah. Ať už je to hraním nejnovějších videoher, sledováním nejnovějších technologických novinek nebo zapojením s ostatními stejně smýšlejícími jedinci online je Alexova láska k technologiím a hrám evidentní ve všem, co on dělá.
Alex je poháněn vášní pro technologie a herní obsah. Ať už je to hraním nejnovějších videoher, sledováním nejnovějších technologických novinek nebo zapojením s ostatními stejně smýšlejícími jedinci online je Alexova láska k technologiím a hrám evidentní ve všem, co on dělá.