快

訊

WBC韓國隊左右打各半柳志炫：為平衡苦惱了3年

蘇花公路大清水路段坍方　和仁至崇德段預警性封閉

總統：研議暫停藥價調查3年　盤點供應建立藥物韌性

宜蘭市連環車禍　1人命危3人受傷

捷克斯柯達汽車75億蓋新電池廠強化在地生產韌性

今彩539第115058期　頭獎槓龜

全英羽球公開賽　邱品蒨、林湘緹女單皆止步16強

義大利防長：美以空襲伊朗已違反國際法

威力彩第115019期　頭獎槓龜

國民黨版國防特別條例出爐　府：支持政院版挺國軍

WBC韓國文保景滿貫砲　單場4轟擊垮捷克首戰奪勝

俄羅斯無人機黑海夜襲　運烏克蘭玉米貨輪受損1傷

推動藥品韌性供應鏈　經部：生醫與產創條例租稅優惠

WBC韓國隊左右打各半柳志炫：為平衡苦惱了3年

DeepSeek-R1登上自然期刊訓練成本不到千萬

2025-09-18 13:49:00 / 中央社 /

分享：

字級：

（中央社台北18日電）年初成為人工智慧（AI）領域熱門話題的DeepSeek-R1，相關論文登上最新一期「自然」期刊，是首個通過同行評議的主要大型語言模型（LLM），文章顯示其訓練成本僅29.4萬美元（約新台幣882萬元）。

這篇題為「DeepSeek-R1透過強化學習激勵大型語言模型推理」的論文由DeepSeek（深度求索）公司團隊完成、DeepSeek創辦人梁文鋒擔任通訊作者，18日刊發在「自然」（Nature）期刊上。而這一期封面即以AI的自我學習和改良為主題。

陸媒界面新聞報導，這篇新版DeepSeek-R1論文，與今年1月未經同行評審的預印本有較大差異，作者根據評審意見增加了模型訓練的技術細節說明，包括模型訓練數據類型和安全性考慮等，並回應了先前關於知識「蒸餾」的質疑。

據報導，DeepSeek明確否認了先前關於其使用OpenAI模型輸出進行訓練的質疑。DeepSeek-V3 Base（DeepSeek-R1的基座模型）使用的數據全部來自網際網路，雖然可能包含GPT-4生成的結果，但絕非有意而為之，也沒有專門的蒸餾環節。

DeepSeek還透露，為了防止基準測試數據汙染，對DeepSeek-R1的預訓練和後訓練數據都實施了全面的去汙染措施。

報導指出，DeepSeek-R1的核心創新在於採用了「純強化學習」這一自動化試錯方法，R1透過獎勵模型達到正確答案的行為來學習推理策略，而非傳統模仿人類預設的推理模式。

在補充材料中，DeepSeek團隊還首次公開了R1訓練成本僅為29.4萬美元，即使加上約600萬美元的基礎模型成本，也遠低於OpenAI、谷歌（Google）訓練AI的成本。

今年1月，當DeepSeek-R1模型發布時，其推理能力和極低的開發成本曾引發全球科技股大幅下跌。

「自然」期刊認為，隨著AI技術日漸普及，大型語言模型廠商們無法驗證的宣傳可能對社會帶來真實風險。依靠獨立研究人員進行的同行評審，是抑制AI行業過度炒作的一種有效方式。

DeepSeek是2023年成立於杭州的人工智慧公司。創始團隊由梁文鋒領銜，成員來自頂尖高校與國際機構技術專家。今年8月21日，DeepSeek正式發布了最新大語言模型DeepSeek-V3.1。（編輯：張淑伶/呂佳蓉）1140918

綜合上一篇綜合下一篇

休旅車連撞11汽機車釀1傷　駕駛見肇事竟下車落跑｜華視新聞 20260306 @CtsTw #shorts

墾丁畢旅吃生蠔6人上吐下瀉　疑食物中毒衛生局稽查｜華視新聞 20260306 @CtsTw #shorts

將提李貞秀當選無效之訴？　中選會：人數不足難討論｜華視新聞 20260306 @CtsTw #shorts

扯！23歲毒駕男載19歲妻「8連撞」　女師停紅燈枉死｜華視新聞 20260306 @CtsTw #shorts

2014/10/04 10:42

國際

莊智淵告別亞運最後奪銅

More...

2014/09/28 14:35

運動

亞運棒球日「扣倒」中國奪銅

More...

2014/09/26 19:45

運動

亞運再添銅陳士杰舉重105KG季軍

More...

HOT

2024/01/14 10:49

選後新政局

葛來儀：民進黨3連勝顯示台灣選擇延續性

三國演議

⏰播出時間：華視主頻 CH12 週一二早上6點