打開 App

  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出

數發部:台灣AI語料庫 預計2、3個月內釋出首波資料

本文共504字

中央社 記者蘇思云台北18日電

台灣打造主權AI訓練語料庫,數發部今天表示,6月開始與各部會盤點各項語言資料,評估是否納入AI訓練語料庫,目前確定客語、原住民語將會放入,同時數發部研議語料庫行動計畫,盼政府機關與民間響應資料共享與活化應用,預計2、3個月內展開第一階段語言資料釋出,屆時包括政府法人或產業,皆可申請使用。

立法院交通委員會今天邀數發部長黃彥男就「推動AI之產業發展政策」進行專題報告,並備質詢。

民進黨立委徐富癸關注,數發部正推動台灣主權AI語料庫,但現在語言資料可能偏重政府文書資料,擔心出現語料偏誤,未來資料庫是否有計畫加入原住民族語言與客語資料等。

黃彥男表示,打造主權AI關鍵在於資料,主權AI語料庫也是未來AI基本法中重要資料治理面向。

數發部資料創新司司長莊明芬指出,語言資料庫將包括文化、歷史、地理等豐富語言資料,6月會找各部會盤點重要語料庫,近期內部也在研擬語料庫行動計畫,後續如果搭配數發部提出的AI語料授權條款,就可以對外釋出。客語、原住民語言的資料,也會納入語料庫。

至於時程規劃,莊明芬表示,目前正在做基本訓練規劃,也同步建置系統中,首要工作是先充實語言資料,預計2到3個月會先把第一階段的語料釋出。

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容

延伸閱讀

上一篇
徐巧芯反惡罷後援會成立 朱立倫、黃國昌力挺
下一篇
綠電好市多強攻購售電 台智電擬包下離岸風電1GW

相關

熱門

看更多

看更多

留言

完成

成功收藏,前往會員中心查看!