國科會發展台灣可信任AI對話引擎 盼守住繁中語料
(中央社記者張璦台北14日電)政府單位、金融業等資料具機敏性,不能萬事問ChatGPT,國科會主委吳政忠今天表示,發展「可信任人工智慧對話引擎」(TAIDE)是「打地基」,未來提供公私部門加值應用、向上「蓋樓房」,也是守住台灣擁有的豐富、珍貴繁體中文語料。
隨英文、簡體中文版聊天機器人相繼問世,相關爭議叢生。國科會拍板,公私協力發展融合台灣元素、以正體中文為主的「可信任人工智慧對話引擎」(Trustworthy AI Dialog Engine,TAIDE),計畫經費約新台幣2億元至3億元。
國科會今天召開記者會,公布第一階段完成了「7B」中模型(參數量為70億),此模型是在LLaMA(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校。
在計畫起步階段、時間與資料有限下,實測自動摘要、翻譯文本、寫信及寫文章等4方面,TAIDE「7B模型」均有不錯表現,尤其對於繁體中文的處理能量及回答,更為穩定準確。
行政院政委兼國科會主委吳政忠坦言,台灣投入TAIDE預算經費「小小小」,這筆錢拿去買房確實可以買到「大房」,但拿去跟在開發引擎的歐美科技大廠相比,一定是少的;台灣不是要做泛用型,而是從基礎引擎做起「打地基」,未來「上面要蓋什麼樣的樓房」,將攜手公部門、業者做各種應用,達成綜效(synergy)。
吳政忠指出,後續各單位可依照需求選擇適用的模型大小,並衡量所需算力及成本,自行運用加值,加速台灣各領域掌握自主性的能力。
台灣之所以必須自己來,是因為「有些東西不能隨便問別人」。吳政忠舉例,台灣公家單位、金融業、科技大廠等資料具機敏性,當然不能問ChatGPT,畢竟AI不斷在學習,資料數據一輸入,無形中就被收走了;再者,台灣擁有豐富繁體中文語料,是「寶貝」,這部分也要守住。
國科會科技政策諮詢專家室資通訊群組召集人李育杰指出,TAIDE計畫考慮兼容、包容性,未來不管是台語、客語都會概括。
針對繁體中文語料的使用,國科會官員及TAIDE團隊表示,目前洽談合作中,後續將取得更大範圍的資料。
國科會打造TAIDE,聚集國內相關領域最頂尖的教授團隊,負責指導核心模型及對話學習技術開發;國科會轄下法人機構,例如國研院國網中心負責建置新一代超級電腦,以提升算力資源,並提供應用服務平台;科政中心則負責徵集處理訓練資料。
此外,數位發展部負責驗測環境架構的發展,並針對計畫所產出的模型進行評測,以提供可信任的證據基礎。(編輯:張良知)1120614
延伸閱讀
- 國科會率團訪歐洲量子科技重鎮 盼深化合作2023/06/19
- 災防中心與印度大學合作簽備忘錄 創新地震防災科技2023/04/10
- AI眼中的「台灣水姑娘」長這樣!網友驚見「台灣政治人物」2023/06/19
- 簡立峰:AI可搶救少子高齡化 延續台灣半導體優勢2023/04/12
- 深化國際研發能量 國科會與日量子電腦專家談合作2023/06/01
- 杜奕瑾:台灣AI發展具信任度優勢 籲法規接軌國際2023/05/09
- 黃仁勳:AI讓電腦產業重生 更是台灣黃金契機2023/05/27
- 台灣太空國際年會10月底首度登場 預計逾千人與會2023/06/20
- 家有小噴火龍?調查揭6成1歲幼兒用3C不利情緒發展2023/04/12
- 拚科技外交 吳政忠率團訪美英推科研合作2023/06/01
- 吳政忠:全球未來20年產業創新不能沒有台灣2023/06/13
- AI賽局參戰 台版生成式對話引擎初代模型近日亮相2023/06/11








