Meta, 음성 생성 도구를 위한 다목적 AI인 Voicebox 소개 – TechCult
잡집 / / June 17, 2023
메타 다재다능한 도구를 사용하여 생성 AI 및 음성 텍스트 생성 기술의 혁신을 소개합니다. 보이스박스. 새로운 AI 모델은 편집, 샘플링 및 스타일 지정과 같은 작업을 수행할 수 있습니다.
최고 수준의 오디오 클립을 생성하고 미리 녹음된 오디오를 수정하는 기능은 Voicebox의 주목할만한 기능입니다. 오디오의 원래 본질과 톤을 유지하면서 자동차 경적이나 개 짖는 소리와 같은 파괴적인 소리를 효과적으로 제거할 수 있습니다. 또한 이 모델은 여러 언어에 능통하여 동일한 능력으로 6개 언어로 음성을 전달할 수 있습니다.
생성 AI 모델 Voicebox와 같은 메타버스는 가상 어시스턴트와 플레이어가 아닌 캐릭터에게 생생한 음성을 제공할 수 있는 잠재력을 가지고 있습니다. 회사는 다음과 같은 새로운 도구를 발표하면서 공유한 블로그에서 비전을 공유했습니다. “미래에는 Voicebox와 같은 다목적 생성 AI 모델이 메타버스에서 가상 비서와 플레이어가 아닌 캐릭터에게 자연스러운 음성을 제공할 수 있습니다. 시각 장애가 있는 사람들이 AI가 읽어주는 친구의 메시지를 음성으로 들을 수 있게 하고 제작자에게 비디오용 오디오 트랙을 쉽게 만들고 편집할 수 있는 새로운 도구를 제공하는 등의 작업을 수행할 수 있습니다.”
Meta의 새 도구는 다음 작업을 수행할 수 있습니다.
- 문맥 내 텍스트-음성 합성: Voicebox는 샘플이 2초 정도로 작은 경우에도 오디오 샘플을 분석하고 복제하는 놀라운 기능을 가지고 있습니다. 이는 Voicebox가 식별된 오디오 스타일을 효과적으로 사용하여 생성할 수 있음을 의미합니다. 텍스트 음성 변환 원하는 사운드 및 톤과 밀접하게 일치하는 결과를 얻을 수 있습니다.
- 음성 편집 및 노이즈 감소: Voicebox는 전체 음성을 완전히 다시 녹음할 필요 없이 소음으로 인해 중단된 음성 섹션을 재구성하거나 잘못된 단어를 변경할 수 있습니다. 이를 통해 효율적이고 정확한 수정이 가능하여 프로세스에서 시간과 노력을 절약할 수 있습니다.
- 다국어 스타일 전송: Voicebox는 다양한 언어에 쉽게 적응하여 놀라운 다재다능함을 보여줍니다. 음성 샘플과 영어, 프랑스어, 독일어, 스페인어, 폴란드어 또는 포르투갈어로 된 텍스트 구절을 활용하여 이 도구는 이러한 언어로 된 텍스트의 오디오 읽기를 생성할 수 있습니다.
- 다양한 음성 샘플링: 다양한 데이터 세트에 대한 광범위한 노출 덕분에 Voicebox는 실제 상호 작용에서 발견되는 자연스러운 대화 패턴을 밀접하게 에뮬레이트하는 음성을 생성하는 기능을 획득했습니다.
처럼 생성 AI 기술 계속 발전하면서 많은 기업에서 사용자에게 더 나은 경험을 제공하기 위해 새롭고 개선된 도구를 제공하고 있습니다. 이제 Meta가 Voicebox 음성 생성 AI 도구를 도입함에 따라 회사는 다양한 기능을 통해 혁신적인 기술의 디딤돌이 되기를 희망합니다.
원천: 메타 뉴스룸
알렉스 크레이그
Alex는 기술 및 게임 콘텐츠에 대한 열정으로 움직입니다. 최신 비디오 게임을 하거나, 최신 기술 뉴스를 접하거나, 참여를 통해 같은 생각을 가진 다른 사람들과 온라인에서 기술과 게임에 대한 Alex의 사랑은 그가 한 모든 것에서 분명합니다. 하다.
Alex는 기술 및 게임 콘텐츠에 대한 열정으로 움직입니다. 최신 비디오 게임을 하거나, 최신 기술 뉴스를 접하거나, 참여를 통해 같은 생각을 가진 다른 사람들과 온라인에서 기술과 게임에 대한 Alex의 사랑은 그가 한 모든 것에서 분명합니다. 하다.