Meta представляє Voicebox, універсальний інструмент для генерації мовлення – TechCult
Різне / / June 17, 2023
Мета представляє прорив у технології генеративного штучного інтелекту та генерації мовлення в текст за допомогою універсального інструменту Голосова скринька. Нова модель AI може виконувати такі завдання, як редагування, вибірка та стилізація.
![Meta представляє Voicebox — універсальний інструмент штучного інтелекту для створення мовлення](/f/6ddab5f3542f929782c23613c35f51fe.png)
Можливість створювати першокласні аудіозаписи та змінювати попередньо записане аудіо є помітною особливістю Voicebox. Він може ефективно усувати неприємні звуки, такі як гудки автомобіля чи гавкіт собак, зберігаючи оригінальну суть і тон аудіо. Крім того, ця модель володіє багатьма мовами, що дозволяє їй вимовляти мову шістьма різними мовами з рівним рівнем володіння.
генеративні моделі ШІ такі як Voicebox, мають потенціал для надання реалістичних голосів віртуальним помічникам і неігровим персонажам у метавсесвіті. Компанія поділилася своїм баченням у блозі, де оголосила про новий інструмент, зазначивши: «У майбутньому багатоцільові генеративні моделі штучного інтелекту, такі як Voicebox, зможуть надавати природно звучачі голоси віртуальним помічникам і персонажам, які не є гравцями в метавсесвіті. Вони могли б дозволити людям із вадами зору чути письмові повідомлення від друзів, прочитані ШІ їхнім голосом, дати творцям нові інструменти для легкого створення та редагування звукових доріжок для відео та багато іншого».
Новий інструмент від Meta може виконувати за вас такі завдання:
- Синтез тексту в мовлення в контексті: Voicebox має надзвичайну здатність аналізувати та відтворювати зразки звуку, навіть якщо вибірка становить лише дві секунди. Це означає, що Voicebox може ефективно використовувати визначений стиль звуку для створення перетворення тексту в мовлення результати, які точно відповідають бажаному звуку та тону.
- Редагування мовлення та зменшення шуму: Voicebox може реконструювати фрагменти мовлення, які були порушені шумом, або змінювати неправильно вимовлені слова, і все це без необхідності повного перезапису всієї мови. Це дозволяє вносити ефективні та точні виправлення, заощаджуючи час і зусилля в процесі.
- Передача міжмовного стилю: Voicebox демонструє свою надзвичайну універсальність, легко адаптуючись до різних мов. Використовуючи зразок мовлення та уривок тексту англійською, французькою, німецькою, іспанською, польською чи португальською, інструмент може створити аудіочитання тексту будь-якою з цих мов.
- Різноманітна вибірка мовлення: Завдяки широкому використанню різноманітних наборів даних Voicebox набув здатності створювати мовлення, яке точно імітує природні шаблони розмови, які можна знайти під час взаємодії в реальному світі.
як генеративна технологія ШІ продовжує прогресувати, багато корпорацій пропонують нові та вдосконалені інструменти, щоб надати користувачам кращий досвід. Тепер, коли Meta представляє інструмент штучного інтелекту для генерації мови Voicebox, компанія сподівається, що його універсальні функції дозволять йому стати сходинкою в революційній технології.
Джерело: Мета Newsroom
![Алекс Крейг](/f/82c0af5dbedfba7e1fc95a8d7136c74d.jpg)
Алекс Крейг
Алекс керує пристрастю до технологій та ігрового контенту. Граючи в новітні відеоігри, слідкуючи за останніми технічними новинами чи залучаючи разом з іншими однодумцями в мережі, любов Алекса до технологій та ігор помітна в усьому, що він робить.
Алекс керує пристрастю до технологій та ігрового контенту. Граючи в новітні відеоігри, слідкуючи за останніми технічними новинами чи залучаючи разом з іншими однодумцями в мережі, любов Алекса до технологій та ігор помітна в усьому, що він робить.