Meta predstavuje Voicebox, všestranný nástroj AI na generovanie reči – TechCult
Rôzne / / June 17, 2023
Meta predstavuje prelom v generatívnej AI a technológii generovania reči na text pomocou všestranného nástroja Hlasová schránka. Nový model AI dokáže vykonávať úlohy, ako sú úpravy, vzorkovanie a štylizácia.
Schopnosť vytvárať špičkové zvukové klipy a upravovať vopred nahraný zvuk je pozoruhodnou vlastnosťou Voiceboxu. Dokáže efektívne eliminovať rušivé zvuky ako trúbenie auta alebo štekot psov pri zachovaní pôvodnej podstaty a tónu zvuku. Okrem toho tento model ovláda viacero jazykov, čo mu umožňuje poskytovať reč v šiestich rôznych jazykoch s rovnakou znalosťou.
generatívne modely AI ako Voicebox majú potenciál poskytnúť realistické hlasy virtuálnym asistentom a postavám, ktoré nie sú hráčmi v rámci metaverza. Spoločnosť zdieľala svoju víziu v blogu, ktorý zdieľala, kde oznámila nový nástroj a uviedla, „V budúcnosti by viacúčelové generatívne modely AI, ako je Voicebox, mohli poskytnúť prirodzene znejúce hlasy virtuálnym asistentom a nehráčskym postavám v metaverze. Mohli by umožniť ľuďom so zrakovým postihnutím počuť písané správy od priateľov, ktoré číta AI v ich hlasoch, poskytnúť tvorcom nové nástroje na jednoduché vytváranie a úpravu zvukových stôp pre videá a oveľa viac.“
Nový nástroj od Meta môže za vás vykonávať nasledujúce úlohy:
- Kontextová syntéza textu na reč: Voicebox má pozoruhodnú schopnosť analyzovať a replikovať zvukové vzorky, aj keď je vzorka malá ako dve sekundy. To znamená, že Voicebox dokáže efektívne využiť identifikovaný zvukový štýl na generovanie prevod textu na reč výsledky, ktoré sa presne zhodujú s požadovaným zvukom a tónom.
- Úprava reči a redukcia šumu: Voicebox dokáže rekonštruovať úseky reči, ktoré boli narušené hlukom alebo zmeniť nesprávne vyslovené slová, a to všetko bez toho, aby bolo potrebné úplne znova nahrať celú reč. To umožňuje vykonávať efektívne a presné opravy, čo šetrí čas a námahu v procese.
- Prenos štýlu medzi jazykmi: Voicebox predvádza svoju pozoruhodnú všestrannosť jednoduchým prispôsobením rôznym jazykom. Využitím vzorky reči a textovej pasáže v angličtine, francúzštine, nemčine, španielčine, poľštine alebo portugalčine môže nástroj generovať zvukové čítanie textu v ktoromkoľvek z týchto jazykov.
- Rôznorodé vzorkovanie reči: Vďaka rozsiahlemu vystaveniu rôznym súborom údajov získal Voicebox schopnosť generovať reč, ktorá presne napodobňuje prirodzené konverzačné vzorce vyskytujúce sa v interakciách v reálnom svete.
Ako generatívna technológia AI stále napreduje, mnohé korporácie prinášajú nové a vylepšené nástroje, aby používateľom poskytli lepšie skúsenosti. Teraz, keď Meta predstavuje nástroj AI na generovanie reči Voicebox, spoločnosť dúfa, že jej všestranné funkcie jej umožnia stať sa odrazovým mostíkom v revolučnej technológii.
Zdroj: Meta Newsroom
Alex Craig
Alex je poháňaný vášňou pre technológie a herný obsah. Či už ide o hranie najnovších videohier, sledovanie najnovších technologických noviniek alebo o zaujatie Alexova láska k technológiám a hrám je evidentná vo všetkom, čo on robí.
Alex je poháňaný vášňou pre technológie a herný obsah. Či už ide o hranie najnovších videohier, sledovanie najnovších technologických noviniek alebo o zaujatie Alexova láska k technológiám a hrám je evidentná vo všetkom, čo on robí.