03/09 週一 彰化縣|19°C - 23°C天氣圖標

國科會發展台灣可信任AI對話引擎 盼守住繁中語料

2023-06-14 19:34:00 / 中央社 /
分享:
字級:
  • 大字
  • 中字
  • 小字

(中央社記者張璦台北14日電)政府單位、金融業等資料具機敏性,不能萬事問ChatGPT,國科會主委吳政忠今天表示,發展「可信任人工智慧對話引擎」(TAIDE)是「打地基」,未來提供公私部門加值應用、向上「蓋樓房」,也是守住台灣擁有的豐富、珍貴繁體中文語料。

隨英文、簡體中文版聊天機器人相繼問世,相關爭議叢生。國科會拍板,公私協力發展融合台灣元素、以正體中文為主的「可信任人工智慧對話引擎」(Trustworthy AI Dialog Engine,TAIDE),計畫經費約新台幣2億元至3億元。

國科會今天召開記者會,公布第一階段完成了「7B」中模型(參數量為70億),此模型是在LLaMA(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校。

在計畫起步階段、時間與資料有限下,實測自動摘要、翻譯文本、寫信及寫文章等4方面,TAIDE「7B模型」均有不錯表現,尤其對於繁體中文的處理能量及回答,更為穩定準確。

行政院政委兼國科會主委吳政忠坦言,台灣投入TAIDE預算經費「小小小」,這筆錢拿去買房確實可以買到「大房」,但拿去跟在開發引擎的歐美科技大廠相比,一定是少的;台灣不是要做泛用型,而是從基礎引擎做起「打地基」,未來「上面要蓋什麼樣的樓房」,將攜手公部門、業者做各種應用,達成綜效(synergy)。

吳政忠指出,後續各單位可依照需求選擇適用的模型大小,並衡量所需算力及成本,自行運用加值,加速台灣各領域掌握自主性的能力。

台灣之所以必須自己來,是因為「有些東西不能隨便問別人」。吳政忠舉例,台灣公家單位、金融業、科技大廠等資料具機敏性,當然不能問ChatGPT,畢竟AI不斷在學習,資料數據一輸入,無形中就被收走了;再者,台灣擁有豐富繁體中文語料,是「寶貝」,這部分也要守住。

國科會科技政策諮詢專家室資通訊群組召集人李育杰指出,TAIDE計畫考慮兼容、包容性,未來不管是台語、客語都會概括。

針對繁體中文語料的使用,國科會官員及TAIDE團隊表示,目前洽談合作中,後續將取得更大範圍的資料。

國科會打造TAIDE,聚集國內相關領域最頂尖的教授團隊,負責指導核心模型及對話學習技術開發;國科會轄下法人機構,例如國研院國網中心負責建置新一代超級電腦,以提升算力資源,並提供應用服務平台;科政中心則負責徵集處理訓練資料。

此外,數位發展部負責驗測環境架構的發展,並針對計畫所產出的模型進行評測,以提供可信任的證據基礎。(編輯:張良知)1120614

寄生套房?霸住長達3年 房東收管理費通知才發現|華視新聞 20260309 @CtsTw #shorts
謝衣鳯表態選彰縣長 謝典霖曝「家人不支持仍要選」|華視新聞 20260309 @CtsTw #shorts
目睹警匪飛車當街追逐 駕駛見義勇為助攔車|華視新聞 20260309 @CtsTw #shorts
卓榮泰赴日應援WBC中國氣炸 日方:台灣問題立場不變|華視新聞 20260309 @CtsTw #shorts
餅乾代工拚創新 美味行銷世界
2017/09/01 12:47
台灣之光
餅乾代工拚創新 美味行銷世界
三國演議
三國演議
⏰播出時間:華視主頻 CH12 週一二 早上6點