經濟日報 App
  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出

Meta AI MMS模型 可辨識全球超過4000種語言

本文共664字

聯合報 記者馬瑞璿/台北即時報導

世界上許多語言正面臨消失危機,Meta今日宣布,旗下大規模多語言語音模型(MSS)能擴展文字轉語音及語音轉文字技術應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,是過去的10倍,此外,還能夠辨識超過4000種口語語言,是過去的40倍。

Meta指出,這項技術已有許多應用案例,從 VR(虛擬實境)、AR(擴增實境) 至訊息服務,不僅能夠使用偏好的語言操作,更可理解每個人的聲音。Meta將開放這項技術的原始碼及模型,讓研究社群能以現有工作成果為基礎繼續開發,一同保存全球的言,拉近人們的距離。

過去,大型語音資料庫最多僅能涵蓋100種語言,因此,Meta開發此技術所面臨的第一個挑戰,即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文的「聖經」,作為語言文字訓練資料。

聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。

Meta指出,雖然資料集收錄聲音以男性居多,但測試成果顯示,不論是男性或女性的聲音,此語音模型皆能同等準確地辨識。此外,上述的語言訓練資料大多為宗教相關的內容,但分析顯示,這並不會使模型傾向生成出更多的宗教性質語言。

Meta表示,將持續擴增大規模多語言語音模型涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。

Meta大規模多語言語音模型擴語音技術的應用範圍,從100種語言,至今已可轉換超...
Meta大規模多語言語音模型擴語音技術的應用範圍,從100種語言,至今已可轉換超過1100種語言。圖/Meta提供

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容

延伸閱讀

上一篇
立積法說會/樂觀看未來營運 下半年全球市場有望回溫
下一篇
京元電出售陸廠 、加碼台灣 退出大陸半導體製造業務

相關

熱門

看更多

看更多

留言

完成

成功收藏,前往會員中心查看!