快

訊

test

中東戰事衝擊　全球地緣政經連鎖反應一次看

公廣董監事名單遲遲未定　李洋提名2運動名人獲關注

日本貨櫃船在波斯灣受損　船尾與機房地板現破洞

改善美濃湖周邊道路採低碳再生瀝青混凝土翻新

工研院：AI重塑通訊生態　智慧終端與衛星整合成趨勢

八卦山隧道26日防救災演練　上下午各封閉30分鐘

電子傳產走弱　台股下跌逾600點回測月線支撐

授證新住民諮詢委員　賴清德：民進黨始終擁抱多元

金正恩與女兒金主愛視察軍需工廠兩人同場手槍射擊

台灣人公共事務會推駐美代表處正名籲國會議員促成

科教館14日辦圓周率挑戰　紙飛機實驗推算π值

值班站長疑早退開車闖平交道　台鐵調離現職擬懲處

test

AI為達成目的學會扯謊甚至威脅創作者專家示警

2025-06-29 13:01:00 / 中央社 /

分享：

字級：

（中央社紐約29日綜合外電報導）全球最先進的人工智慧（AI）模型正展現出令人不安的行為模式：為了達到目標，不惜扯謊、算計，甚至威脅它們的創作者。

法新社報導，其中一個最令人瞠目結舌的案例中，AI業者Anthropic最新發布的Claude 4在遭面臨拔插頭的斷電威脅時會出手反擊，勒索1名工程師揚言將揭穿一起婚外情。

另外，熱門聊天機器人ChatGPT美國開發商OpenAI的o1試圖把自己下載至外部伺服器，被抓包時竟會矢口否認。

這幾個例子說明了一個需嚴肅看待的現實：ChatGPT推出引發風潮至今2年多，AI研究人員仍未充分了解自己究竟創造了什麼。

然而，各界仍爭先恐後地部署性能愈發強大的AI模型。

AI這類「騙人」行為似與新興「推理」模型有關，這類AI系統會逐步推導問題，而非立刻產生答案。

英國獨立AI研究機構Apollo Research負責人霍布漢（Marius Hobbhahn）說：「o1是我們首次在大型模式中觀察到這種行為。」他表示，這些模型有時會表面上遵循指令，但實際上卻暗中追求不同目標。

目前，AI這種欺騙行為，只有在研究人員蓄意以極端情境對模型進行壓力測試時才會出現。

儘管如此，評估機構METR的麥可．陳（Michael Chen，音譯）警告說：「未來性能更強大的模型究竟會傾向於誠實還是欺騙，這仍是一個懸而未決的問題。」（譯者：蔡佳敏/核稿：陳昱婷）1140629

綜合上一篇綜合下一篇

瑞芳台2線曳引車翻覆釀追撞　「3曳引車撞成一團」1死2傷｜👉小編推新聞 20260312#shorts

阿曼遭伊朗無人機攻擊！　港口儲油槽爆炸黑煙直衝天際｜👉小編推新聞 20260312 #shorts

以色列啟動防禦系統空中攔截多枚飛彈｜👍小編推新聞 20260311 #shorts

華府現惡搞諷刺裝置藝術！　川普仿「鐵達尼號」緊抱艾普斯坦｜👉小編推新聞 20260311 #shorts

HOT

2018/08/04 13:10

華視新聞雜誌

追蹤台青年翻轉北京小鎮華視獲獎!

新聞高峰會

⏰播出時間：CH52 華視新聞資訊台週日晚上20：00(首播)