Meta, 4000개 이상의 음성 언어를 식별하는 음성 AI 모델 소개 – TechCult
잡집 / / May 23, 2023
획기적인 발표에서, 메타혁신적인 플랫폼과 기술을 제공하는 거대 기술 기업인, 일련의 인공 언어 접근성과 보존. 수많은 언어의 소멸이 임박한 상황과 기존 음성인식 및 생성기술의 한계를 인식한 메타의 새로운 대규모 다국어 음성(MMS) AI 모델 언어 장벽을 해소하고 개인이 정보에 액세스하고 선호하는 언어로 장치와 상호 작용할 수 있도록 하는 것을 목표로 합니다.
목차
4,000개 이상의 음성 언어 식별
약 100개 언어를 포괄하는 현재 음성 기술을 통해 Meta의 MMS 모델은 이 범위를 놀라운 수준으로 확장했습니다. 1,100개 언어- 10배 증가. 또한 이러한 고급 AI 모델은 4,000개 이상의 구어를 식별하는 능력, 놀라운 40배 향상. 이문화 커뮤니케이션과 언어 포용성에 대한 의미는 심오합니다.
선호하는 언어로 원활한 상호 작용
가상 및 증강 현실 경험에서 메시징 서비스에 이르기까지 이러한 AI 모델은 이제 사람들이 선호하는 언어로 된 음성을 이해하고 해석할 수 있습니다. 언어 다양성에 관계없이 원활한 상호 작용 가능. 비전은 세상을 육성하는 것입니다 언어는 더 이상 장벽이 아닙니다, 모두가 가장 편안하게 느끼는 언어로 기술과 소통할 수 있는 곳입니다.
종교적 텍스트의 혁신적인 사용
이러한 모델을 개발하면서 Meta가 직면한 주요 문제 중 하나는 수천 개의 언어에 대한 오디오 데이터의 부족이었습니다. 기존 음성 데이터 세트는 최대 100개 언어를 지원했습니다. 독창성으로, 메타는 광범위하게 번역되고 연구된 성경과 같은 종교 문서로 눈을 돌렸습니다.
1,100개 언어로 된 신약 성경 읽기
공개적으로 사용 가능한 이러한 번역의 오디오 녹음을 활용하여 Meta는 1,100개 이상의 언어로 된 신약 성경 읽기를 특징으로 하는 데이터 세트를 편집했습니다. 언어당 평균 32시간의 데이터를 제공합니다.
언어 지원 범위가 4,000개 언어로 확장됨
언어 적용 범위를 더욱 확장하기 위해 Meta는 다양한 기독교 종교 읽기의 레이블 없는 녹음을 통합하여 사용 가능한 언어의 수를 4,000개 이상으로 늘렸습니다. 비록 데이터는 주로 남성 화자로 구성됨 종교적 내용에 대해 Meta의 분석은 모델은 남성과 여성의 목소리 모두에 대해 똑같이 잘 수행합니다.. 또한 모델은 더 종교적인 언어를 생성하는 데 편향되지 않음을 보여 출력의 잠재적 왜곡에 대한 우려를 완화했습니다.
언어 보존을 위한 메타 오픈 소스 모델 및 코드
결정적으로 Meta는 다음을 선택했습니다. 모델과 코드 모두 오픈 소스, 다른 연구자들이 그들의 작업을 기반으로 전 세계 언어의 보존 및 접근성에 기여. 이 협력적 접근 방식은 언어 보존에 대한 노력을 통합하고 세상을 더 가깝게 만드는 메타의 노력을 강조합니다.
또한 Meta의 Massively Multilingual Speech AI 모델 도입은 최근 공개된 프로젝트와 완벽하게 일치합니다. AI 모델 전용으로 제작된 최초의 맞춤형 실리콘 칩 개발. 이 중대한 발전은 AI 인프라를 혁신하고, AI 연구를 촉진하고, 새로운 메타버스를 형성하기 위한 Meta의 중요한 전략의 필수적인 부분입니다.
AI 모델의 기능을 개선하고 확장함으로써 Meta는 언어 장벽을 허물고 언어 다양성을 바탕으로 번성하는 글로벌 커뮤니티를 육성하는 것을 목표로 합니다.
원천: 메타 뉴스룸
알렉스 크레이그
Alex는 기술 및 게임 콘텐츠에 대한 열정으로 움직입니다. 최신 비디오 게임을 하거나, 최신 기술 뉴스를 접하거나, 참여를 통해 같은 생각을 가진 다른 사람들과 온라인에서 기술과 게임에 대한 Alex의 사랑은 그가 한 모든 것에서 분명합니다. 하다.
Alex는 기술 및 게임 콘텐츠에 대한 열정으로 움직입니다. 최신 비디오 게임을 하거나, 최신 기술 뉴스를 접하거나, 참여를 통해 같은 생각을 가진 다른 사람들과 온라인에서 기술과 게임에 대한 Alex의 사랑은 그가 한 모든 것에서 분명합니다. 하다.