Meta打造台語英語AI翻譯 台灣鄉土劇有貢獻

(中央社記者陳至中台北20日電)臉書母公司Meta昨天宣布推出由人工智慧(AI)技術支援的閩南語(台語)、英語即時互譯系統。台灣大學電機系副教授李宏毅今天透露,台灣鄉土劇在訓練機器過程中,扮演一定角色。
網路科技公司Meta宣布建立一套AI系統,可讓台灣常用的閩南語(影片中稱為福建話Hokkien)和英語互譯,引起台灣社會關注。
台灣大學電機工程學系副教授李宏毅參與的研究團隊,收集1500小時的台灣鄉土劇資料,在Meta這次的AI系統中扮演一定角色。李宏毅今天下午接受中央社電訪指出,鄉土劇最大的特色是有閩南語聲音訊號,還有文字字幕可對照,機器可因此學到「成對」的資訊。
李宏毅解釋,過去AI翻譯做得比較好的,大都是使用人數多、資料量大的語言,例如中文轉英文,會有人願意投入大量資源去收集資料、標註。但對於沒有那麼多人使用的語言,還要投入那麼多的人力,就沒那麼划算。
他指出,Meta技術上的突破,在於讓機器透過大量沒有標註的資料「自監督學習(Self-Supervised Learning)」。就像是人類幼童學習母語,都是先大量聽人說話,在腦中形成一定的概念,等上學後老師提點一下,就能很快學會該語言的系統。
Meta也是先讓機器聽一大堆沒有文字標註的聲音,對語言有一定程度瞭解後,再給予一些「成對」資料提點,進而很快學會這種語言。台灣鄉土劇就是作為提點的關鍵角色之一。
李宏毅解釋,鄉土劇最大的好處,在於除了有聲音訊號,還有文字字幕可以對照,這就是「成對」的資料,對機器來說,這是非常好的教材。Meta也運用了Taiwanese Across Taiwan(TAT)的閩南語語音語料庫來訓練,幫助提高準確率。
李宏毅也指出,Meta技術的一個特點是「語音直接轉語音」,有別於傳統的方法,是先將語音轉換成文字,翻譯成另一種語言的文字後,再套語音模組。傳統方法的最大壞處,就是只要其中一個環節出錯,錯誤就會一路傳遞下去。
他說,「語音轉語音」能減少錯誤傳遞的問題,另一大好處是,人類講話會帶情緒,語氣輕重都會影響意義。因此直接語音轉語音,就能保留這些情緒,讓翻譯更為準確。這項技術特別適合用在無法打字的場合,例如「元宇宙」中;或用於缺乏書寫系統的語言。
不過,李宏毅說,Meta今天的影片看起來很強,但若認真去看論文並去實際嘗試,就會知道離真正應用到日常生活中,還有一大段距離。如果是娛樂性質,翻錯1、2個字無傷大雅,但若要用在正式溝通場合,就不是目前技術能做到。
李宏毅認為,AI短時間內不能完全取代翻譯的工作,畢竟翻譯是一種「藝術」。但隨著科學發展,AI應可「幫得上忙」,例如先大致翻譯出一個版本,再由人類進一步編修,減輕工作負擔。(編輯:陳政偉)1111020
延伸閱讀
- 唐鳳:AI是輔助式智慧 要在不破壞價值跟常規下運用2022/10/26
- Meta財報黯然失色 Q3獲利銳減Q4財測疲弱2022/10/27
- Meta資本支出不減反增 台系雲端概念股鬆口氣2022/10/29
- 撼訊台科大聯合研發中心成立 培育AI高科技人才2022/10/27
- 民進黨雲林縣黨部臉書專頁遭惡意侵入 31日將報警2022/10/30
- 和祖克柏說台語!Meta首款台語翻譯機 是台灣人開發的2022/10/20
- Meta屢違競選獻金法遭罰7.8億元 美史最高2022/10/27
- 隱形危機 搶救阿母的話|我的母語消失中系列報導|華視新聞雜誌2022/06/24
- 用台語打造AI翻譯系統 Meta陳鵬仁:開民宿伯父想買2022/10/27
- Meta AI翻譯台語變調挑戰大 未來考慮納入客語2022/10/26
- 荷蘭「台灣商機日」 新創業者合作擴大國際市場2022/10/28
- Meta台語AI翻譯 專家實測:早期測試準確率待加強2022/10/20








