-
DeepSeek-R1模型震驚硅谷,美媒:制裁反而促進(jìn)中國(guó)創(chuàng)新
最后更新: 2025-01-27 15:17:04【文/觀察者網(wǎng) 陳思佳】這兩天,中國(guó)人工智能公司深度求索(DeepSeek)發(fā)布的大模型DeepSeek-R1震動(dòng)業(yè)界,該模型使用更低的成本和更小的算力規(guī)模,實(shí)現(xiàn)了足以匹敵美國(guó)頂尖AI模型的效果。這一成果引發(fā)全球科技行業(yè)高度關(guān)注,西方媒體也發(fā)文感嘆“中國(guó)AI模型震驚硅谷”。
最新消息顯示,DeepSeek已經(jīng)登頂了中國(guó)和美國(guó)的蘋(píng)果App Store應(yīng)用商店,排名第一,將ChatGPT一舉超越。對(duì)于一款中國(guó)大模型來(lái)說(shuō),能夠在美國(guó)力壓ChatGPT,是絕無(wú)僅有的歷史性一刻。
據(jù)美國(guó)《華爾街日?qǐng)?bào)》當(dāng)?shù)貢r(shí)間1月26日?qǐng)?bào)道,DeepSeek-R1的出色表現(xiàn)已經(jīng)給美國(guó)科技行業(yè)留下深刻印象,從業(yè)者紛紛稱(chēng)贊深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言,美國(guó)試圖通過(guò)制裁限制中國(guó)的AI發(fā)展,但資源的限制反而激發(fā)了中國(guó)科研人員的創(chuàng)造力。
深度求索在1月20日發(fā)布了DeepSeek-R1模型,該公司表示,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,其性能比肩美國(guó)OpenAI o1正式版。
為促進(jìn)技術(shù)社區(qū)的充分交流與創(chuàng)新協(xié)作,深度求索還公開(kāi)了DeepSeek-R1訓(xùn)練技術(shù)。
DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比較 DeepSeek微信公眾號(hào)
一些第三方測(cè)試結(jié)果也顯示,DeepSeek-R1的表現(xiàn)足以匹敵美國(guó)頂尖AI模型。美國(guó)加州大學(xué)伯克利分校研究人員設(shè)立的聊天機(jī)器人競(jìng)技場(chǎng)(Chatbot Arena)平臺(tái)上,DeepSeek-R1和去年12月發(fā)布的DeepSeek-V3的性能表現(xiàn)均位列前十。
不僅如此,DeepSeek的開(kāi)發(fā)成本和使用的算力規(guī)模都遠(yuǎn)低于美國(guó)頂尖AI公司。先前發(fā)布的DeepSeek-V3在僅使用2048顆英偉達(dá)H800 GPU的情況下,完成了6710億參數(shù)模型的訓(xùn)練,成本約為560萬(wàn)美元,這遠(yuǎn)低于其他頂級(jí)模型的訓(xùn)練成本。美媒指出,H800的算力要弱于英偉達(dá)H100等芯片,美國(guó)限制對(duì)華出口此類(lèi)高性能芯片。
《華爾街日?qǐng)?bào)》提到,作為對(duì)比,美國(guó)AI企業(yè)、Claude模型開(kāi)發(fā)商Anthropic首席執(zhí)行官達(dá)里奧·阿莫代伊(Dario Amodei)去年曾透露,該公司構(gòu)建模型的成本約為1億至10億美元。
與其他一些頂尖大模型不同,DeepSeek-R1沒(méi)有使用傳統(tǒng)的監(jiān)督微調(diào)(SFT)方法,而是專(zhuān)注于強(qiáng)化學(xué)習(xí)(RL),這意味著該模型跳過(guò)了使用人工標(biāo)準(zhǔn)數(shù)據(jù)訓(xùn)練的“模仿”環(huán)節(jié)。
英偉達(dá)高級(jí)研究科學(xué)家范麟熙(Jim Fan)稱(chēng)贊DeepSeek取得了突破,他在社交平臺(tái)X上發(fā)文稱(chēng),DeepSeek-R1完全由強(qiáng)化學(xué)習(xí)驅(qū)動(dòng),“這讓人想起了AlphaZero,從零開(kāi)始學(xué)習(xí)圍棋、將棋和國(guó)際象棋,而不是先模仿人類(lèi)大師的動(dòng)作。這是論文中最重要的收獲?!?
DeepSeek-R1的表現(xiàn)引起美國(guó)科技行業(yè)的高度關(guān)注。硅谷風(fēng)險(xiǎn)投資家馬克·安德森(Marc Andreessen)表示:“DeepSeek-R1是我見(jiàn)過(guò)的最令人驚嘆,最令人印象深刻的突破之一。”
舊金山AI硬件公司Positron的聯(lián)合創(chuàng)始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在討論DeepSeek的開(kāi)源模型,“這太酷了?!?
一些美國(guó)企業(yè)也開(kāi)始在工作中使用DeepSeek。硅谷一家創(chuàng)業(yè)公司的聯(lián)合創(chuàng)始人安東尼·普奧(Anthony Poo)告訴《華爾街日?qǐng)?bào)》,他們?cè)仁褂肅laude模型預(yù)測(cè)財(cái)務(wù)回報(bào),但現(xiàn)在已轉(zhuǎn)向DeepSeek,兩者性能相似,使用DeepSeek的成本僅為Claude的四分之一。
普奧說(shuō):“OpenAI的模型有著極佳的性能,但我們不想為我們不需要的能力付費(fèi)?!?
截至北京時(shí)間今早,DeepSeek在美區(qū)蘋(píng)果App Store免費(fèi)榜上已經(jīng)排在第一位,力壓此前霸榜的ChatGPT。而就在昨天早上,DeepSeek還沒(méi)有擠進(jìn)榜單前五,顯示出過(guò)去24小時(shí)發(fā)酵速度之快。在國(guó)區(qū)蘋(píng)果App Store免費(fèi)榜,DeepSeek也已登頂。
DeepSeek已在蘋(píng)果App Store國(guó)區(qū)和美區(qū)免費(fèi)榜登頂
近年來(lái),美國(guó)在芯片等領(lǐng)域?qū)χ袊?guó)實(shí)施出口限制,試圖打壓中國(guó)在AI等領(lǐng)域的發(fā)展,但深度求索依然能構(gòu)建出匹敵美國(guó)頂尖科技公司的AI模型。OpenAI前高管扎克·卡斯直言,美國(guó)的限制未能阻止DeepSeek的進(jìn)步,“這凸顯了一個(gè)深刻的教訓(xùn):資源限制反而能激發(fā)創(chuàng)造力?!?
數(shù)字新聞雜志The Wire China發(fā)文稱(chēng),DeepSeek-R1的發(fā)布將迫使懷疑論者重新評(píng)估中國(guó)的技術(shù)發(fā)展。深度求索對(duì)開(kāi)源承諾的堅(jiān)持也與OpenAI的專(zhuān)有策略形成鮮明對(duì)比,深度求索允許全球企業(yè)和開(kāi)發(fā)者共同開(kāi)發(fā)和改進(jìn)技術(shù),OpenAI則限制對(duì)其系統(tǒng)的訪問(wèn)以維護(hù)競(jìng)爭(zhēng)優(yōu)勢(shì)。
該雜志指出,美國(guó)決策者應(yīng)該反思,通過(guò)設(shè)置障礙來(lái)確保領(lǐng)先地位的方法是否還行得通。美國(guó)的出口管制促使中國(guó)加速實(shí)現(xiàn)技術(shù)的自給自足,中美在芯片等領(lǐng)域的技術(shù)差距正逐漸縮小,美國(guó)的制裁雖然具有破壞性,卻可能反過(guò)來(lái)助推中國(guó)的創(chuàng)新能力。
文章寫(xiě)道,美國(guó)的出口管制不僅削弱了美國(guó)科技公司的收入,也導(dǎo)致全球半導(dǎo)體供應(yīng)鏈變得愈發(fā)“支離破碎”,“美國(guó)越是專(zhuān)注于遏制對(duì)手而不解決自身的缺陷,就越有可能加速其領(lǐng)先地位的喪失?!?
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
標(biāo)簽 人工智能- 責(zé)任編輯: 陳思佳 
-
加拿大媒體炮轟:我們都快被特朗普蛐蛐死了,你人呢?
2025-01-27 14:51 應(yīng)對(duì)特朗普沖擊波 -
美國(guó)務(wù)院下死令
2025-01-27 14:48 美國(guó)政治 -
“我永遠(yuǎn)不會(huì)反華,美國(guó)收買(mǎi)不了我”
2025-01-27 14:11 中國(guó)外交 -
“伊朗還盯著呢!怎么能把他們安保撤了?”
2025-01-27 12:17 應(yīng)對(duì)特朗普沖擊波 -
他又挑撥!越南總理表態(tài)
2025-01-27 11:49 南海局勢(shì) -
濟(jì)州航空空難初步調(diào)查報(bào)告公布:撞機(jī)4分鐘前黑匣子停止記錄
2025-01-27 11:46 三八線之南 -
丹麥被貼臉開(kāi)大:笑死,多搞幾條狗,你也好意思…
2025-01-27 11:08 應(yīng)對(duì)特朗普沖擊波 -
“美中如果有更多的雙贏元素,那就太好了”
2025-01-27 10:50 中美關(guān)系 -
芝加哥、亞特蘭大、洛杉磯……美國(guó)開(kāi)始非法移民大抓捕
2025-01-27 10:31 美國(guó)政治 -
軍機(jī)遣返移民被拒后,特朗普加稅25%!哥倫比亞硬剛
2025-01-27 10:11 應(yīng)對(duì)特朗普沖擊波 -
中薩(摩亞)政府簽署互免簽證協(xié)定
2025-01-27 10:01 -
巴勒斯坦、約旦、埃及全都反對(duì)!哈馬斯回懟
2025-01-27 08:43 巴以恩仇錄 -
白宮:黎以?;饏f(xié)議延長(zhǎng)至2月18日
2025-01-27 08:20 -
官宣!盧卡申科勝選
2025-01-27 08:00 -
馬斯克提議:將“英吉利海峽”更名為“喬治·華盛頓海峽”
2025-01-27 07:43 應(yīng)對(duì)特朗普沖擊波 -
美新任防長(zhǎng)與以總理通話:美國(guó)將與以色列站在一起
2025-01-27 07:33 巴以恩仇錄 -
伊朗“加沙”重型無(wú)人機(jī)首次亮相
2025-01-27 07:05 伊朗局勢(shì) -
拉脫維亞與瑞典的一條水下光纜遭到損壞
2025-01-27 07:05 歐洲亂局 -
盧卡申科將贏得白俄大選:出口民調(diào)87.6%
2025-01-27 07:05 -
李強(qiáng)同外國(guó)專(zhuān)家舉行新春座談會(huì)
2025-01-27 07:05
相關(guān)推薦 -
真急了!“請(qǐng)求中國(guó)取消限制” 評(píng)論 55歐盟多國(guó)大停電,“我們需要中國(guó)技術(shù)” 評(píng)論 108中俄元首在主觀禮臺(tái)出席紅場(chǎng)閱兵式 評(píng)論 57英方拿到了,“簡(jiǎn)直像在平行宇宙,中國(guó)太超前了” 評(píng)論 87“全球都將研究,中國(guó)與西方最強(qiáng)大武器直接對(duì)決” 評(píng)論 390最新聞 Hot
-
真急了!“請(qǐng)求中國(guó)取消限制”
-
嚴(yán)管執(zhí)行!中方再出手,美媒發(fā)愁
-
俄副總理:中俄“西伯利亞力量-2”項(xiàng)目談判取得進(jìn)展
-
“歐洲在華企業(yè)偷著樂(lè):機(jī)會(huì)來(lái)了”
-
歐盟多國(guó)大停電,“我們需要中國(guó)技術(shù)”
-
普京閱兵式演講,特別提到中國(guó)
-
“對(duì)華閹割版,又要降級(jí)”
-
“全球都將研究,中國(guó)與西方最強(qiáng)大武器直接對(duì)決”
-
英方拿到了,“簡(jiǎn)直像在平行宇宙,中國(guó)太超前了”
-
微軟:從中企學(xué)到,誰(shuí)先一步拿下,誰(shuí)就難被取代
-
美國(guó)農(nóng)民發(fā)愁:雞爪、魚(yú)頭...除了中國(guó),好難找到買(mǎi)家
-
首位“美國(guó)教皇”利奧十四世是誰(shuí)?
-
許紅兵,主動(dòng)投案
-
美國(guó)官員:殲-10擊落陣風(fēng),沒(méi)用F-16
-
特朗普:對(duì)華關(guān)稅145%到頂了,要降
-
美大使污蔑“中國(guó)不是好盟友”,我駐巴拿馬使館駁斥
-