打開 App

  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出

聯和科創打造「跨域語音增強」技術 大展 AI 創新實力

本文共886字

經濟日報 記者吳康瑋/台北即時報導

智通科創(8932)子公司聯和科創12日宣布,團隊在語音增強領域取得重大突破,利用「生成對抗網絡(GAN)」和「噪聲提取」等前沿 AI 技術,成功開發出一種「跨域語音增強」的新方法,透過這種全新的方法,大家將能在先前未可見不可預測的聲學環境中,有效抑制噪聲並增強語音的模型,並能顯著提升語音在挑戰性聲學環境中的清晰度及可理解性。

聯和科創旗下AI部門主管李鴻欣近日攜手國立台灣師範大學陳柏琳博士,在國際頂尖會議「IEEE 語音語言技術研討會( SLT 2024)」上發表這項最新技術。團隊指出,傳統的語音增強技術常面臨在不可預測的現實聲學環境中表現不穩定的問題,而聯和科創團隊利用生成對抗網絡(GAN)和噪聲提取等前沿 AI 技術,成功開發出一個能在先前未可見不可預測的聲學環境中有效抑制噪聲並增強語音的模型。

IEEE(電氣電子工程師學會)是一個全球性專業組織,專注電氣工程、電子工程、計算機科學以及相關技術的發展。它是全球最大的技術專業組織之一,對於科技領域的創新和標準化具有重要影響。而聯和科創此次登上這場重要研討會,並闡述了如何運用新穎的資料模擬方法,克服在未知目標域中噪聲和背景信息有限的挑戰。並透過採用噪聲編碼器和動態隨機擾動,能有效地模擬多樣的噪聲條件,使該模型能很好地適應未知的聲學環境。

這次聯和科創於SLT 2024發表的內容記載於《利用動態隨機擾動實現域自適應語音增強的有效噪聲感知資料模擬》的論文,該技術主要是行業標準VoiceBank-DEMAND基準資料集上,進行嚴格測試,並證明該方法的優越性,在多個客觀和主觀指標上均優於現有的最新語音增強技術。這一成功彰顯了該技術在依賴清晰且準確的語音通信的應用中具有顛覆性的潛力。

李鴻欣指出,通過有效縮小訓練和實際部署之間的差距,我們的方法為語音助理、視訊會議系統、助聽器及輔助技術等應用領域的顯著性能提升開啟了大門。聯和科創指出,團隊計劃在各種挑戰性環境和資料集上進行廣泛測試,進一步驗證和完善該方法,聯和科創對研發持續投入的承諾,將確保公司在提供有影響力的 AI 驅動解決方案方面保持領先並賦能各行業用戶。

聯和科創展現AI創新實力。聯合報系資料照
聯和科創展現AI創新實力。聯合報系資料照
聯和科創於IEEE發表跨域語音增強新突破。聯和科創/提供
聯和科創於IEEE發表跨域語音增強新突破。聯和科創/提供

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容

上一篇
風訓公司培訓風電人才引進造浪球 最大浪高80公分
下一篇
華為三折機不夠看 蘋果研發四折機 新日興、兆利將成大贏家

相關

熱門

看更多

看更多

留言

完成

成功收藏,前往會員中心查看!