-
中國(guó)AI公司幾個(gè)月就弄通了OpenAI的推理模型,美研究人員:我們很驚訝
最后更新: 2024-12-25 13:18:24【文/觀察者網(wǎng) 賴家琪】“中國(guó)初創(chuàng)公司已展現(xiàn)出趕超美國(guó)人工智能(AI)模型的跡象,而且他們追趕的速度比許多業(yè)內(nèi)人士預(yù)期的要快。”美國(guó)《華爾街日?qǐng)?bào)》在12月24日的一篇報(bào)道中,通過對(duì)比中美兩國(guó)AI企業(yè)推理模型的表現(xiàn)以及研發(fā)速度,得出了以上結(jié)論。
11月,由中國(guó)私募巨頭幻方量化投資的AI公司DeepSeek(深度求索)發(fā)布了其推理模型DeepSeek-R1的預(yù)覽版。根據(jù)DeepSeek的說法,這一模型的能力已接近甚至超越了OpenAI于今年9月發(fā)布的推理模型o1的預(yù)覽版。
除了DeepSeek外,擁有中國(guó)互聯(lián)網(wǎng)巨頭阿里巴巴和騰訊投資的初創(chuàng)公司Moonshot AI(月之暗面)表示,他們開發(fā)了一種專門用于數(shù)學(xué)的模型,其功能接近o1。阿里巴巴也稱,他們自己的一個(gè)實(shí)驗(yàn)?zāi)P驮诮鉀Q數(shù)學(xué)問題上的表現(xiàn)優(yōu)于美國(guó)模型的預(yù)覽版。
《華爾街日?qǐng)?bào)》稱,由于這些公司尚未發(fā)表描述其模型的論文,且現(xiàn)在沒有一致認(rèn)可的對(duì)AI模型能力進(jìn)行評(píng)估的單一測(cè)試,目前很難驗(yàn)證這些中國(guó)公司的說法。盡管如此,一些美國(guó)專家表示,他們對(duì)此“印象深刻”。
“中國(guó)正在更快地迎頭趕上?!監(jiān)penAI前研究員、現(xiàn)為AI企業(yè)家的安德魯·卡爾(Andrew Carr)說,DeepSeek研究員在“在幾個(gè)月內(nèi)就弄通了OpenAI推理模型的辦法,坦率地說,我的許多同事都對(duì)此感到驚訝”。
《華爾街日?qǐng)?bào)》用今年美國(guó)數(shù)學(xué)競(jìng)賽AIME中的15個(gè)問題進(jìn)行了測(cè)試。他們發(fā)現(xiàn),OpenAI的推理模型還是要比中國(guó)幾家公司的推理模型更快地找到答案。測(cè)試結(jié)果顯示,OpenAI模型在10秒內(nèi)給出了答案,而DeepSeek花了2分多鐘。
不過,該報(bào)仍稱贊了DeepSeek的表現(xiàn),稱在目前很多AI模型被簡(jiǎn)單數(shù)學(xué)問題難倒的情況下,DeepSeek第一次就得到正確答案是“一項(xiàng)壯舉”。
DeepSeek(深度求索)官網(wǎng)
中國(guó)AI公司能在短時(shí)間內(nèi)達(dá)成“壯舉”得益于多重原因。
與許多美國(guó)公司不同,大部分中國(guó)公司更愿意與其他企業(yè)和軟件開發(fā)商共享底層代碼。這種共享代碼的行為在AI領(lǐng)域被稱為“開源”。美國(guó)《紐約時(shí)報(bào)》稱,開源一直是計(jì)算機(jī)軟件、互聯(lián)網(wǎng)以及當(dāng)前AI發(fā)展的基石,因?yàn)殚_源的支持者認(rèn)為,當(dāng)代碼可供任何人免費(fèi)檢查、使用和改進(jìn)時(shí),技術(shù)就會(huì)進(jìn)步得更快。
“開源技術(shù)是中國(guó)的戰(zhàn)略優(yōu)勢(shì)。”美國(guó)《科技時(shí)報(bào)》12月17日稱,中國(guó)公司讓任何人都能接觸到模型源代碼,可以在全球范圍內(nèi)引發(fā)創(chuàng)新并建立開發(fā)人員社區(qū),這不僅推動(dòng)了技術(shù)的進(jìn)步,而且使中國(guó)的模型出現(xiàn)在全球AI地圖上。
《紐約時(shí)報(bào)》也注意到了開源模式給中國(guó)帶來的優(yōu)勢(shì)。該報(bào)稱,2023年年底有人發(fā)現(xiàn),李開復(fù)創(chuàng)建的AI公司01.AI(零一萬物)使用了美國(guó)公司Meta的開源模型構(gòu)建其AI系統(tǒng)。但轉(zhuǎn)折發(fā)生在6個(gè)月后。當(dāng)時(shí),01.AI發(fā)布了新一代模型,美國(guó)斯坦福大學(xué)的一個(gè)團(tuán)隊(duì)也在那段時(shí)間也推出了Llama 3-V開源模型。但隨后,Llama 3-V很快被爆出與中國(guó)大模型公司面壁智能的開源成果MiniCPM-Llama3-V 2.5擁有幾乎完全相同的模型架構(gòu)與代碼,引發(fā)“抄襲”質(zhì)疑。
該報(bào)指出,這與01.AI去年面臨的爭(zhēng)議相反:中國(guó)開發(fā)人員不再在美國(guó)技術(shù)之上構(gòu)建,而是美國(guó)開發(fā)人員在中國(guó)技術(shù)之上構(gòu)建。
總部位于紐約的AI公司Hugging Face(抱抱臉)的首席執(zhí)行官克萊門特·德朗格(Clément Delangue)表示,美國(guó)監(jiān)管機(jī)構(gòu)限制美國(guó)的開源項(xiàng)目,中國(guó)的開源模型成為黃金標(biāo)準(zhǔn),此類事情可能會(huì)成為常態(tài),“如果這種趨勢(shì)繼續(xù)下去,美國(guó)將面臨越來越大的挑戰(zhàn)”。
為了扼制中國(guó)發(fā)展AI的能力,美國(guó)政府自2022年來一直在限制中國(guó)獲得世界上最先進(jìn)的AI芯片。今年12月,臨卸任的拜登政府再次收緊了對(duì)中國(guó)出口AI芯片的途徑。
但是,《華爾街日?qǐng)?bào)》稱,中國(guó)開發(fā)人員已經(jīng)找到了解決方法。Moonshot AI創(chuàng)始人楊植麟稱,該公司專注于強(qiáng)化學(xué)習(xí)(Reinforcement Learning,一種機(jī)器學(xué)習(xí)方法),模仿人類的試錯(cuò)。報(bào)道稱,這種方法在提高性能時(shí),可能會(huì)減少算力的使用強(qiáng)度。
《華爾街日?qǐng)?bào)》報(bào)道稱,自去年年底以來,AI開發(fā)人員越來越多地使用一種稱為“混合專家模型”(MoE)的技術(shù)。該技術(shù)將問題引導(dǎo)到專門的子模型(即“專家”)處去解決問題,就像主廚將意大利面訂單定向到廚房的意大利廚師處那樣。這個(gè)過程也減輕了對(duì)芯片的要求。
騰訊的混合專家模型于今年11月發(fā)布。據(jù)稱,該模型的性能與Meta今年7月推出的Llama 3.1模型相當(dāng)。審查了兩家公司論文的研究人員表示,騰訊的模型可能僅用了Meta約1/10的算力訓(xùn)練的。
DeepSeek在2021年用1萬個(gè)英偉達(dá)A100芯片構(gòu)建了一個(gè)用于AI訓(xùn)練的Fire-Flyer 2集群。今年8月,DeepSeek在一篇論文中表示,F(xiàn)ire-Flyer 2的性能接近于英偉達(dá)的一個(gè)包含類似芯片的系統(tǒng),但DeepSeek的系統(tǒng)成本更低,能耗更低。
美國(guó)AI初創(chuàng)公司Anthropic聯(lián)合創(chuàng)始人杰克·克拉克(Jack Clark)在他的博客中寫道,“中國(guó)繞過出口管制的一種方式是,利用他可以訪問的硬件構(gòu)建非常好的軟件和硬件訓(xùn)練堆棧”,“就像電動(dòng)汽車、無人機(jī)和其他技術(shù)一樣,中國(guó)制造將在AI模型中占據(jù)一席之地”。
《華爾街日?qǐng)?bào)》指出,缺乏尖端芯片、籌資難等問題仍是中國(guó)AI公司面臨的幾大挑戰(zhàn)。但接受該報(bào)采訪的中國(guó)AI公司高管將這比作帶著鐐銬跳舞,他表示“專注于我們擅長(zhǎng)的事情是生存的唯一機(jī)會(huì),而且可能是獲勝”。
《科技時(shí)報(bào)》稱,美國(guó)和中國(guó)在AI生態(tài)系統(tǒng)上的競(jìng)爭(zhēng),與過去windows和iOS操作系統(tǒng)的競(jìng)爭(zhēng)類似,贏家可能會(huì)主導(dǎo)數(shù)字行業(yè),影響未來幾年全球市場(chǎng)和用戶的行為。雖然美國(guó)制裁很難突破,但中國(guó)更加專注于開源模型和國(guó)內(nèi)創(chuàng)新,這使它成為世界上最大的AI大國(guó)之一?!叭澜缍荚诘戎矗袊?guó)是否會(huì)超越西方競(jìng)爭(zhēng)對(duì)手。”
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 賴家琪 
-
“特朗普:加拿大、格陵蘭、巴拿馬,全都要,買買買”
2024-12-25 11:55 特朗普 -
“如果我是特朗普,就再搞‘尼克松訪華’行動(dòng)”
2024-12-25 11:40 中美關(guān)系 -
國(guó)臺(tái)辦正告臺(tái)當(dāng)局:膽敢鋌而走險(xiǎn),必將自取滅亡
2024-12-25 11:37 臺(tái)灣 -
全國(guó)人大外事委員會(huì):強(qiáng)烈不滿、堅(jiān)決反對(duì)
2024-12-25 11:28 中美關(guān)系 -
手機(jī)都要搭載AI了,智能眼鏡為何沒有大突破?
2024-12-25 11:24 -
中方反制后加拿大再次顛倒黑白,我使館發(fā)聲
2024-12-25 10:54 -
巖屋毅今訪華:不能重蹈錯(cuò)誤國(guó)策
2024-12-25 10:39 日本 -
特朗普懟拜登:我一就職,就要大力推死刑!
2024-12-25 10:32 美國(guó)一夢(mèng) -
“中國(guó)人學(xué)習(xí)能力強(qiáng)又勤奮,美國(guó)卡不住脖子”
2024-12-25 10:20 -
澤連斯基:感謝中國(guó)
2024-12-25 09:11 中國(guó)外交 -
美政府審查最后一刻仍無共識(shí),球踢給拜登
2024-12-25 08:40 美國(guó)一夢(mèng) -
克林頓已出院,病因公布
2024-12-25 08:18 美國(guó)政治 -
敘利亞各方達(dá)成協(xié)議:解散所有武裝派別
2024-12-25 07:56 -
阿富汗臨時(shí)政府稱巴基斯坦轟炸該國(guó)一地
2024-12-25 07:13 阿富汗 -
“特朗普的當(dāng)代美國(guó)‘天命論’霸凌,只會(huì)把盟友推向中國(guó)”
2024-12-24 23:18 應(yīng)對(duì)特朗普沖擊波 -
俄貨船爆炸沉沒,正執(zhí)行敘利亞撤離任務(wù)?
2024-12-24 22:54 俄羅斯之聲 -
也門胡塞武裝稱使用高超音速?gòu)椀缹?dǎo)彈打擊以色列軍事目標(biāo)
2024-12-24 22:50 -
涉華條款全被刪,與他有關(guān)?
2024-12-24 22:35 美國(guó)政治 -
他如何讓敘利亞超越“1400年恩怨”?世界都在看
2024-12-24 22:21 敘利亞內(nèi)戰(zhàn) -
王毅:中國(guó)奉行不干涉內(nèi)政原則,相信韓國(guó)人民有能力妥善處理
2024-12-24 21:24 中國(guó)外交
相關(guān)推薦 -
停火第一夜,印巴互相指責(zé) 評(píng)論 130王毅分別同印巴雙方通話 評(píng)論 212巴防長(zhǎng):核選項(xiàng)不在考慮中,但是… 評(píng)論 97印度稱“不想升級(jí)”,巴方想“就此打住” 評(píng)論 434最新聞 Hot
-
“聽加州的,否則美國(guó)最大經(jīng)濟(jì)體地位不?!?/a>
-
流浪53年后,蘇聯(lián)金星探測(cè)器墜落地球
-
伊朗官員:美國(guó)不真誠(chéng),一開始就設(shè)陷阱
-
?;鸬谝灰?,印巴互相指責(zé)
-
為什么選出美國(guó)籍教皇?梵蒂岡消息人士:還不是因?yàn)樘乩势?/a>
-
普京提議:15日,俄烏直接談
-
王毅分別同印巴雙方通話
-
印度稱“不想升級(jí)”,巴方想“就此打住”
-
英法德波領(lǐng)導(dǎo)人訪問基輔,將與澤連斯基共同討論?;饐栴}
-
印軍否認(rèn)S-400防空系統(tǒng)被摧毀
-
印度前高官:勸巴基斯坦,中國(guó)的話好使
-
空中爆炸!巴軍通報(bào)7日空戰(zhàn)細(xì)節(jié),含擊落“陣風(fēng)”錄音
-
要松口了?印官員稱將“適時(shí)”公開
-
印度32座機(jī)場(chǎng)暫停對(duì)所有民用航班運(yùn)營(yíng)
-
英官員承認(rèn):美英貿(mào)易協(xié)議這條款,沖中國(guó)來的
-
巴外長(zhǎng):印度讓巴基斯坦別無選擇
-