대규모 다국어 음성인식 AI

IT&Tech

대규모 다국어 음성인식 AI

yamujinharim 2023. 5. 25. 17:00

메타(Meta)가 4,000개 이상의 음성 언어를 식별하고, 약 1,100개 언어를 음성↔텍스트로 상호 변환하는 대규모 다국어 음성인식(Massively Multilingual Speech·MMS) AI 모델을 오픈소스로 공개했다고 24일 밝혔습니다.

현재 세계에서 사용되는 언어는 7,000개가 넘는데, 참고로 기존 음성인식 모델은 최대 100여개 언어만 지원해왔습니다.
이에 메타는 음성↔텍스트 변환 가능한 언어수를 1,107개로 10배 가량 확대했는데요, 음성으로 식별 가능한 언어도 4,000개 이상으로 늘렸다고 합니다.

메타의 대규모 다국어 음성인식(MMS) 모델에서 지원하는 세계 언어 분포

기존 음성 변환 모델 대비 성능도 우수하다고 합니다. 메타에 따르면 음성 변환 언어의 수를 61개에서 1,107개로 18배 늘렸을 때 문자 오류율은 단 0.4% 증가했다고 합니다.

오픈AI의 음성인식 모델 '위스퍼'와 유사 비교한 결과 MMS 데이터로 교육된 모델은 단어 오류율을 절반으로 줄이면서도 11배 더 많은 언어를 처리할 수 있는 것으로 나타났다고 합니다.

메타의 MMS 프로젝트는 음성 정보에 의존하는 사람들을 비롯해 사람들이 더 쉽게 정보에 접근하고 자신이 원하는 언어로 각종 기기를 사용할 수 있도록 돕는 것을 목표로 하고 있습니다.
메타는 언어 다양성 보존에 기여하고, AI 생태계 전반의 발전과 책임 있는 개발을 위해 MMS 모델과 코드를 오픈소스로 공개했습니다.

수천 개 언어를 지원하는 단일 음성 모델 구축을 위해 적용 언어 범위를 늘리고, 기존 음성 기술로는 다루기 어려운 방언 처리 문제도 연구하는데요. 발전된 음성인식 기술은 VR·AR(가상·증강현실)이나 메시지 서비스에도 적용할 수 있습니다.

메타는 "MMS 프로젝트는 더 많은 사람들이 쉽게 정보에 접근하고 자신이 원하는 언어로 각종 기기를 사용할 수 있도록 돕는 것이 목표"라며 "AI는 메타의 다양한 제품·서비스의 기반이자 메타버스의 근간이 되는 핵심기술로 연구와 투자를 지속하고 있다"고 말했습니다.

저작자표시

'IT&Tech' 카테고리의 다른 글

엔비디아, MS, DELL의 인공지능 공동개발 (51)	2023.05.30
마이크로소프트 윈도우11 '23H2'버전의 새로운 기능들 (54)	2023.05.26
뒤통수의 구글과 의리의 삼성! (54)	2023.05.23
OpenAI의 ChatGPT를 iPhone에서도 사용 가능 (60)	2023.05.22
AI챗봇 ChatGPT가 해커들의 조력자?? (46)	2023.05.19

현재글대규모 다국어 음성인식 AI

세상에서 가장 재미있고 야무진 이야기들

세상에 있는 수 많은 재미있고 흥미진진한 이야기들을 야무지게 살펴서 야무지게 알려드릴께요~ : )

구글, ChatGPT, 마이크로소프트, Chat GPT, kakao, Google, 2024년, 증강현실, LLM, openAI, samsung, 비트코인, Bard, Bing, GPU, Ai, 클라우드, 챗GPT, 인공지능, meta,

Today :
Yesterday :

세상에서 가장 재미있고 야무진 이야기들