Meta는 1,600개 이상의 언어를 전사할 수 있는 다국어 ASR 모델을 갖춘 오픈 소스 AI로 돌아왔습니다. 완벽가이드
Meta는 1,600개 이상의 언어를 전사할 수 있는 다국어 ASR 모델을 갖춘 오픈 소스 AI로 돌아왔습니다.
IT/기술 전문 정보
Meta는 1,600개 이상의 언어를 지원하는 새로운 다국어 자동 음성 인식(ASR) 시스템을 출시했습니다. 이는 99개만 지원하는 OpenAI의 오픈 소스 Whisper 모델을 능가하는 것입니다. 또한 아키텍처를 통해 개발자는 해당 지원을 수천 개 이상으로 확장할 수 있습니다. 제로샷 상황 내 학습이라는 기능을 통해 사용자는 추론 시 새로운 언어로 된 몇 가지 오디오와 텍스트 쌍의 예를 제공할 수 있으므로 모델이 재교육 없이 해당 언어의 추가 발화를 전사할 수 있습니다. 실제로 이를 통해 잠재적인 적용 범위가 5,400개 이상의
핵심 특징
고품질
검증된 정보만 제공
빠른 업데이트
실시간 최신 정보
상세 분석
전문가 수준 리뷰
상세 정보
핵심 내용
Meta는 1,600개 이상의 언어를 지원하는 새로운 다국어 자동 음성 인식(ASR) 시스템을 출시했습니다. 이는 99개만 지원하는 OpenAI의 오픈 소스 Whisper 모델을 능가하는 것입니다. 또한 아키텍처를 통해 개발자는 해당 지원을 수천 개 이상으로 확장할 수 있습니다. 제로샷 상황 내 학습이라는 기능을 통해 사용자는 추론 시 새로운 언어로 된 몇 가지 오디오와 텍스트 쌍의 예를 제공할 수 있으므로 모델이 재교육 없이 해당 언어의 추가 발화를 전사할 수 있습니다. 실제로 이를 통해 잠재적인 적용 범위가 5,400개 이상의 언어로 확장됩니다
상세 분석
. 이는 알려진 문자가 있는 거의 모든 음성 언어입니다. 이는 정적 모델 기능에서 커뮤니티가 스스로 적응할 수 있는 유연한 프레임워크로의 전환입니다. 따라서 1,600개 언어가 공식적인 교육 범위를 반영하는 반면, 더 넓은 수치는 Omnilingual ASR이 필요에 따라 일반화할 수 있는 능력을 나타내며 현재까지 출시된 가장 확장 가능한 음성 인식 시스템이 되었습니다. 무엇보다도 가장 좋은 점은 일반 Apache 2.0 라이선스에 따라 오픈 소스화되었다는 점입니다.
정리
이는 회사의 이전 릴리스와 같은 제한적인 준 오픈 소스 Llama 라이선스가 아니라 라이선스 비용을 지불하지 않는 한 대기업의 사용이 제한되어 연구원과 개발자가 자유롭게 사용하고 구현할 수 있다는 것입니다. 상업용 및 엔터프라이즈급 프로젝트에서도 제한 없이 무료로 즉시! Hugging Face 및 기술 문서의 데모 공간과 함께 11월 10일 Meta 웹사이트 Github에 출시된 Meta의 Omnilingual ASR 제품군에는 음성 인식 모델 제품군, 70억 매개변수의 다국어 오디오 표현 모델, 이전에 서비스가 충분하지 않았던 350개 이상의 언어에 걸친 대규모 음성 코퍼스가 포함되어 있습니다. 모든 리소스는 오픈 라이센스에 따라 무료로 사용할 수 있으며 모델은 기본적으로 음성-텍스트 전사를 지원합니다. Meta는 XDesigned for Speech-to-Text 전사의 @AIatMeta 계정에 게시한 “이러한 모델과 데이터 세트를 오픈 소스화하여 언어 장벽을 허물고 디지털 액세스를 확장하며 전 세계 커뮤니티에 권한을 부여하는 것을 목표로 합니다.” 기본적으로 Omnilingual ASR은 음성-텍스트 시스템입니다
자주 묻는 질문
Q. 어떤 정보를 제공하나요?
A. IT/기술 관련 최신 정보를 제공합니다.
Q. 신뢰할 수 있나요?
A. 검증된 출처만 선별합니다.
Q. 더 궁금한 점은?
A. 댓글로 문의하세요.
원문 출처
이 글은 원본 기사를 참고하여 작성되었습니다.
이 글과 함께 읽으면 좋은 글
-
→ Sequoia는 Roelof Botha가 물러나면서 Alfred Lin과 Pat Grady를 새로운 공동 관리인으로 지명
2025-11-04
-
→ FBI, ICE로 위장한 범죄자에 대해 경고하고 요원들에게 스스로 신원을 확인하도록 촉구
2025-11-04
-
→ MAGA가 할로윈 의상이 Charlie Kirk를 조롱했다고 주장한 후 교사들은 살해 위협을 받습니다
2025-11-04
-
→ 판매 중인 EU 최고 관료들의 전화 위치 데이터, 보고서 발견
2025-11-04
-
→ Studio Ghibli, Square Enix 등을 대표하는 일본 무역 협회 CODA는 Op
2025-11-03

댓글