台版AI對話引擎年底釋大模型 奠定商業版發展基礎
(中央社記者張璦台北14日電)今天亮相的台版AI對話引擎初代模型,能將「Taiwan’s own Jay Chou」譯成「臺灣歌手周杰倫」,也可自動摘要、寫信推薦台灣旅遊必去景點。國科會表示,希望年底釋出更大的模型,後續團隊擬規劃商業授權版。
人工智慧(AI)浪潮席捲,隨英文、簡體中文版聊天機器人相繼問世,相關爭議叢生,國科會拍板,公私協力發展融合台灣元素、以正體中文為主的「可信任人工智慧對話引擎」(Trustworthy AI Dialog Engine,TAIDE),TAIDE計畫經費約新台幣2億元至3億元。
國科會今天召開記者會,公布第一階段完成「7B」中模型(參數量為70億),此模型是在LLaMA(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校。
何謂「7B」,國科會科技政策諮詢專家室資通訊群組召集人李育杰解釋,參數量越多,代表這模型的複雜度越高,訓練的成本就越大,對應的資料量也得更大;目前ChatGPT採「GPT-3.5」模型則是175B。
談及TAIDE規劃,李育杰表示,目前展示的7B模型可做到自動摘要、翻譯文本、寫信、寫文章等4個面向;在記者會播放的示範影片中,7B模型可翻譯簡短英文段落,把其中的「K-Pop sensation BTS」譯為「韓國男子音樂團體BTS」、「Taiwan’s own Jay Chou」翻成「臺灣歌手周杰倫」。
同時,7B模型可用寫信的方式,推薦台灣旅遊的5個必去景點。
下一步要陸續往大模型推進,李育杰指出,第2階段在任務處理上,包含認識台灣、事實查核與詐騙防範,檢視模型能否成為「好幫手」。
針對第3階段的可信任模型,李育杰說明,是做到信任的提升、阻絕涉及犯罪等不該產生的回應,同時考量倫理因素。
李育杰表示,最後則是整合前面3階段,展示「昇華」系統,讓任務的達成更具水準。
李育杰指出,TAIDE模型訓練由小到大,團隊在過程中累積經驗,是「最科學、最節儉」的方式;下半年國網中心會增設一些新設備,盼10月順利取得全球搶單的H100新GPU,讓H100投入大模型的訓練,過了10月也希望取得較大的算力。
此外,李育杰說,LLaMA是授權學術使用,「不拿去賺錢、大概就沒什麼問題」;不過,呼應業界商用及訓練需求,後續團隊擬規劃商業授權版模型,但這就不會是在LLaMA基礎上。
他指出,業界也很想知道,訓練13B模型要投入多少成本、基礎模型要怎麼樣Fine-Tune(微調)、後續如何加強能力,達到真正的合用,因此團隊希望把SOP、經驗與業界交流。
李育杰表示,未來除做源碼檢測確保資安要求,TAIDE模型能否抵抗「越獄測試」(比如不能問涉及犯罪問題,但換個方法問套出答案),也是關鍵,之後會進行「紅隊演練」 (Red Teaming),由白帽駭客尋找系統可被利用的潛在高度風險弱點。(編輯:林興盟)1120614
延伸閱讀
- 潮流藝術拍賣興起 當代潮流眼光致敬名畫「吻」2023/06/11
- 周杰倫概念股上市喊停 凸顯香港IPO環境低迷2023/06/14
- 周杰倫新歌「倒影」 一天觀看破2百萬人次2023/05/15
- 周杰倫金曲34歌王遺珠 蔡依林夯歌無緣年度歌曲2023/05/16
- 周杰倫、周星馳「雙周合體」 粉絲許願攜手合作2023/05/12
- 金曲34入圍名單完整版 周杰倫6度入圍年度歌曲 徐佳瑩、A-Lin爭歌后2023/05/16
- 哪位藝人翻車最崩潰?網友押寶「5巨星」 感慨:現在誰翻車都不意外2023/06/20
- 周杰倫連3天香港開唱! 粉絲搶嘸票「包遊艇」來聽2023/05/08
- 「周杰倫概念股」巨星傳奇 6月將在香港上市2023/05/26
- 認購周杰倫概念股 1.24萬元起跳2023/05/30
- 周杰倫MV出現「吵什麼吵賴清德」 引賴清德笑回:安靜的沒那麼快2023/06/16
- 周杰倫香港開唱送驚喜 搶先公開「倒影」MV2023/05/14








