A Meta bemutatja a Voiceboxot, egy sokoldalú mesterséges intelligencia beszédgeneráló eszközt – a TechCult
Vegyes Cikkek / / June 17, 2023
Meta áttörést vezet be a generatív mesterséges intelligencia és a beszédből szöveggé generáló technológiában egy sokoldalú eszközzel Voicebox. Az új AI-modell olyan feladatokat tud végrehajtani, mint a szerkesztés, a mintavételezés és a stilizáció.
A Voicebox egyik figyelemre méltó jellemzője a kiváló hangklipek generálása és az előre felvett hang módosítása. Hatékonyan kiküszöböli az olyan zavaró hangokat, mint az autók dudája vagy a kutyaugatás, miközben megőrzi a hang eredeti lényegét és tónusát. Ezen túlmenően ez a modell több nyelven is jártas, így hat különböző nyelven, azonos tudással képes beszédet mondani.
generatív AI modellek mint a Voicebox, képesek élethű hangokat adni a virtuális asszisztenseknek és a metaverzumban nem játszó karaktereknek. A cég egy blogon osztotta meg elképzelését, amelyben bejelentette az új eszközt, és kijelentette: „A jövőben a többcélú generatív AI-modellek, mint például a Voicebox, természetes hangzású hangokat adhatnak a metaverzum virtuális asszisztenseinek és nem játékos karaktereinek. Lehetővé tehetik a látássérültek számára, hogy a mesterséges intelligencia által felolvasott barátok írott üzeneteit hallják a hangjukon, új eszközöket biztosíthatnak az alkotóknak a videók hangsávjainak egyszerű létrehozásához és szerkesztéséhez, és még sok minden mást.”
A Meta új eszköze a következő feladatokat tudja elvégezni Ön helyett:
- Kontextuson belüli szöveg-beszéd szintézis: A Voicebox figyelemre méltó képességgel rendelkezik a hangminták elemzésére és replikálására, még akkor is, ha a minta mindössze két másodperc. Ez azt jelenti, hogy a Voicebox hatékonyan tudja használni az azonosított hangstílust a generáláshoz szöveg-beszéd olyan eredményeket, amelyek szorosan illeszkednek a kívánt hangzáshoz és hangszínhez.
- Beszédszerkesztés és zajcsökkentés: A Voicebox képes rekonstruálni a beszéd olyan szakaszait, amelyeket a zaj megzavart, vagy megváltoztathatja a hibásan kimondott szavakat, mindezt anélkül, hogy a teljes beszédet újra fel kellene venni. Ez hatékony és precíz korrekciókat tesz lehetővé, időt és erőfeszítést takarítva meg a folyamat során.
- Többnyelvű stílusátvitel: A Voicebox figyelemreméltó sokoldalúságát mutatja, hogy könnyen alkalmazkodik a különböző nyelvekhez. Egy beszédminta és egy angol, francia, német, spanyol, lengyel vagy portugál nyelvű szövegrészlet felhasználásával az eszköz hangos felolvasást generálhat a szövegből ezen nyelvek bármelyikén.
- Változatos beszédmintavétel: A különféle adatkészleteknek való kiterjedt expozíciónak köszönhetően a Voicebox képessé vált olyan beszéd létrehozására, amely szorosan utánozza a valós interakciókban fellelhető természetes társalgási mintákat.
Mint generatív AI technológia folyamatosan fejlődik, sok vállalat új és továbbfejlesztett eszközöket hoz, hogy jobb élményt nyújtson a felhasználóknak. Most, hogy a Meta bemutatja a Voicebox beszédgeneráló mesterséges intelligencia eszközt, a vállalat reméli, hogy sokoldalú funkciói lehetővé teszik, hogy a forradalmi technológia lépcsőfokaivá váljon.
Forrás: Meta Híradó
Alex Craig
Alexet a technológia és a játéktartalom iránti szenvedély hajtja. Legyen szó a legújabb videojátékokkal való játékról, a legfrissebb technológiai hírekről való lépésről vagy a lebilincselésről más, hasonló gondolkodású online személyekkel Alexnek a technológia és a játékok iránti szeretete nyilvánvaló mindabban, amit csinál.
Alexet a technológia és a játéktartalom iránti szenvedély hajtja. Legyen szó a legújabb videojátékokkal való játékról, a legfrissebb technológiai hírekről való lépésről vagy a lebilincselésről más, hasonló gondolkodású online személyekkel Alexnek a technológia és a játékok iránti szeretete nyilvánvaló mindabban, amit csinál.