數發部:台灣AI語料庫 預計2、3個月內釋出首波資料
(中央社記者蘇思云台北18日電)台灣打造主權AI訓練語料庫,數發部今天表示,6月開始與各部會盤點各項語言資料,評估是否納入AI訓練語料庫,目前確定客語、原住民語將會放入,同時數發部研議語料庫行動計畫,盼政府機關與民間響應資料共享與活化應用,預計2、3個月內展開第一階段語言資料釋出,屆時包括政府法人或產業,皆可申請使用。
立法院交通委員會今天邀數發部長黃彥男就「推動AI之產業發展政策」進行專題報告,並備質詢。
民進黨立委徐富癸關注,數發部正推動台灣主權AI語料庫,但現在語言資料可能偏重政府文書資料,擔心出現語料偏誤,未來資料庫是否有計畫加入原住民族語言與客語資料等。
黃彥男表示,打造主權AI關鍵在於資料,主權AI語料庫也是未來AI基本法中重要資料治理面向。
數發部資料創新司司長莊明芬指出,語言資料庫將包括文化、歷史、地理等豐富語言資料,6月會找各部會盤點重要語料庫,近期內部也在研擬語料庫行動計畫,後續如果搭配數發部提出的AI語料授權條款,就可以對外釋出。客語、原住民語言的資料,也會納入語料庫。
至於時程規劃,莊明芬表示,目前正在做基本訓練規劃,也同步建置系統中,首要工作是先充實語言資料,預計2到3個月會先把第一階段的語料釋出。(編輯:潘羿菁)1140618
延伸閱讀
- 深耕永續淨零 中油連6年獲亞洲企業社會責任獎2025/06/28
- 新台幣狂飆衝28元 央行踩煞車尾盤翻貶收29.18元2025/06/27
- 強勢! 台幣升破29關卡 「三年來首見」28字頭2025/06/27
- 台幣升值外資買超卻布期指空單 台股返高點多空僵持2025/06/28
- 談新台幣急升 林敏雄:若供應商降價、全聯配合反映2025/06/27
- 新台幣盤中再見28元 國銀:日圓兌換量近期明顯成長2025/06/27
- 台電連8年獲亞洲企業社會責任獎 今年斬獲2獎項2025/06/28
- 國銀對中曝險近8年首度退居第3 與美差距寫新高2025/06/27
- 台廠矽光子供應鏈 經部助穩懋上詮聯發科布局2025/06/28
- 朋程斥資1.92億元 加碼投資功率元件廠ANJET2025/06/27
- AI新十大建設部署矽光子 經部擬啟動試量產線2025/06/28
- 金寶:下半年客戶趨於保守 全年營收拚持平2025/06/27







