Meta представляет Voicebox — универсальный инструмент искусственного интеллекта для генерации речи
Разное / / June 17, 2023
Мета представляет прорыв в технологии генеративного искусственного интеллекта и преобразования речи в текст с помощью универсального инструмента. Голос окно. Новая модель ИИ может выполнять такие задачи, как редактирование, выборка и стилизация.
Возможность создавать первоклассные аудиоклипы и изменять предварительно записанный звук — примечательная особенность Voicebox. Он может эффективно устранять мешающие звуки, такие как автомобильные гудки или лай собак, сохраняя при этом исходную суть и тон звука. Кроме того, эта модель поддерживает несколько языков, что позволяет ей говорить на шести разных языках с одинаковым уровнем владения языком.
генеративные модели ИИ Например, Voicebox может озвучивать виртуальных помощников и неигровых персонажей в метавселенной реалистичными голосами. Компания поделилась своим видением в блоге, в котором объявила о новом инструменте, заявив: «В будущем многоцелевые генеративные модели искусственного интеллекта, такие как Voicebox, смогут давать естественно звучащие голоса виртуальным помощникам и неигровым персонажам в метавселенной. Они могут позволить слабовидящим людям слышать письменные сообщения от друзей, прочитанные искусственным интеллектом их голосами, предоставить создателям новые инструменты для простого создания и редактирования звуковых дорожек для видео и многое другое».
Новый инструмент от Meta может выполнять за вас следующие задачи:
- Контекстный синтез речи: Voicebox обладает замечательной способностью анализировать и воспроизводить аудиосэмплы, даже если сэмпл длится всего две секунды. Это означает, что Voicebox может эффективно использовать определенный стиль звука для создания текст в речь результаты, которые точно соответствуют желаемому звуку и тону.
- Редактирование речи и шумоподавление: Voicebox может реконструировать фрагменты речи, которые были нарушены шумом, или изменить неправильно произнесенные слова, и все это без необходимости полной перезаписи всей речи. Это позволяет вносить эффективные и точные исправления, экономя время и силы в процессе.
- Передача межъязыкового стиля: Voicebox демонстрирует свою замечательную универсальность, легко адаптируясь к различным языкам. Используя образец речи и отрывок текста на английском, французском, немецком, испанском, польском или португальском языке, инструмент может генерировать аудиозапись текста на любом из этих языков.
- Разнообразная выборка речи: Благодаря широкому использованию разнообразных наборов данных Voicebox приобрел способность генерировать речь, которая точно имитирует естественные разговорные модели, характерные для реальных взаимодействий.
Как генеративные технологии искусственного интеллекта продолжает развиваться, многие корпорации приносят новые и улучшенные инструменты, чтобы предоставить пользователям лучший опыт. Теперь, когда Meta представляет инструмент искусственного интеллекта для генерации речи Voicebox, компания надеется, что его универсальные функции позволят ему стать ступенькой в революционной технологии.
Источник: Мета отдел новостей
Алекс Крейг
Алексом движет страсть к технологиям и игровому контенту. Играя в новейшие видеоигры, следя за последними техническими новостями или занимаясь с другими единомышленниками в Интернете, любовь Алекса к технологиям и играм очевидна во всем, что он делает.
Алексом движет страсть к технологиям и игровому контенту. Играя в новейшие видеоигры, следя за последними техническими новостями или занимаясь с другими единомышленниками в Интернете, любовь Алекса к технологиям и играм очевидна во всем, что он делает.