-
美媒緊盯DeepSeek:美國人還能保住AI領(lǐng)先地位嗎,巨額投入是否值得?
-
劉程輝風(fēng)物長宜放眼量
【文/觀察者網(wǎng) 劉程輝】
這些天,中國人工智能公司深度求索(DeepSeek)開發(fā)的AI模型猶如一枚重磅炸彈,給西方業(yè)界造成的沖擊久久未能平息。各大西方媒體乃至AI團(tuán)隊(duì)和投資者都想知道:在沒有頂尖芯片的情況下,中國人是如何用更低的成本,創(chuàng)造出足以匹敵美國頂尖AI模型的產(chǎn)品的?
“中國新型AI模型DeepSeek如何威脅美國的主導(dǎo)地位。”美國消費(fèi)者新聞與商業(yè)頻道(CNBC)1月24日發(fā)表報(bào)道稱,深度求索發(fā)布的AI模型不僅性能超越美國頂尖同類模型,且構(gòu)建成本更低、所用芯片算力也沒那么強(qiáng)大,這一消息在硅谷引發(fā)恐慌,也讓美國人開始擔(dān)憂——美國在全球人工智能領(lǐng)域的領(lǐng)先地位是否正在縮小,科技巨頭在構(gòu)建人工智能模型和數(shù)據(jù)中心上的巨額投入真的還值得嗎?
CNBC注意到,深度求索于去年12月底推出了一款免費(fèi)開源的大語言模型DeepSeek-V3。關(guān)鍵的是,中國人僅用了兩個(gè)月時(shí)間,花費(fèi)不到600萬美元,使用英偉達(dá)算力稍遜的H800芯片就構(gòu)建出了這個(gè)模型。相較之下,谷歌和OpenAI花費(fèi)數(shù)年時(shí)間和數(shù)億美元才取得類似成果。DeepSeek的開源模型已成為許多美國開發(fā)者的基礎(chǔ)。
在一系列第三方基準(zhǔn)測試中,無論是解決復(fù)雜問題還是數(shù)學(xué)和編程等方面,深度求索的模型在準(zhǔn)確率上甚至超過了Meta的Llama 3.1、OpenAI的GPT - 4o以及Anthropic的Claude Sonnet 3.5。
在許多第三方測試中,深度求索本周最新發(fā)布的推理模型DeepSeek-R1同樣超越了OpenAI的最新模型o1。
Deepseek-V3與多個(gè)國內(nèi)外大模型的測試數(shù)據(jù)對比 “Deepseek”公眾號(hào)
“深度求索的新模型實(shí)在令人印象非常深刻?!蔽④浭紫瘓?zhí)行官薩蒂亞·納德拉22日在達(dá)沃斯世界經(jīng)濟(jì)論壇上感慨,“他們能如此高效地開發(fā)出一款開源模型,在推理計(jì)算方面表現(xiàn)出色,計(jì)算效率極高。我們必須極其嚴(yán)肅地看待中國的這些進(jìn)展。”
CNBC稱,令人矚目的是,在取得這樣出色成績的背后,是美國政府對中國實(shí)施的嚴(yán)格半導(dǎo)體限制,這些限制使中國無法獲取英偉達(dá)H100等最強(qiáng)大的芯片。中方的最新進(jìn)展表明,深度求索要么找到了繞過相關(guān)規(guī)則的方法,要么說明美國的出口管制并未達(dá)到華盛頓預(yù)期的限制效果。
標(biāo)桿資本(Benchmark)普通合伙人切坦·普塔貢塔表示:“他們采用優(yōu)秀的預(yù)訓(xùn)練大型模型,并使用蒸餾技術(shù)(distillation),利用大型模型來提升小型模型的特定能力,這是一種非常具有成本效益的方法。”
不僅僅是DeepSeek一家。其他中國AI模型也憑借有限資源在競爭中占據(jù)了一席之地。李開復(fù)的初創(chuàng)公司零一萬物.AI成立八個(gè)月就成為獨(dú)角獸公司,2024年創(chuàng)造近1400萬美元收入,其模型訓(xùn)練成本僅為300萬美元,遠(yuǎn)低于GPT-4的8000萬到1億美元。阿里巴巴的千問也大幅降低了大型語言模型的成本。
美國AI初創(chuàng)企業(yè)Perplexity首席執(zhí)行官阿拉文德·斯里尼瓦斯說:“需求是發(fā)明之母。因?yàn)樗麄儽仨毾氤鲎兺ㄞk法,結(jié)果實(shí)際上構(gòu)建出了效率更高的東西。”
美國《紐約時(shí)報(bào)》也在1月24日的文章中寫到,深度求索開發(fā)的AI系統(tǒng)可與OpenAI和谷歌等公司的尖端聊天機(jī)器人相媲美,能做到這點(diǎn)本已是一個(gè)里程碑,但這個(gè)名為DeepSeek-V3的大模型背后的團(tuán)隊(duì)描述了一個(gè)更大的進(jìn)步——他們在訓(xùn)練該系統(tǒng)時(shí)只用了領(lǐng)先人工智能公司用的高度專業(yè)化計(jì)算機(jī)芯片的一小部分。
自從OpenAI在2022年發(fā)布了ChatGPT,引發(fā)人工智能熱潮以來,許多專家和投資者普遍認(rèn)為,如果不投入數(shù)億美元購買人工智能專用芯片的話,沒有公司能與行業(yè)領(lǐng)軍者競爭。
世界領(lǐng)先的人工智能公司用超級計(jì)算機(jī)來訓(xùn)練它們的聊天機(jī)器人,這些超級計(jì)算機(jī)需要多達(dá)1.6萬個(gè)芯片,甚至更多。但DeepSeek的工程師卻說,他們只用了約2000個(gè)英偉達(dá)生產(chǎn)的專用芯片。
這些芯片是美中激烈技術(shù)競爭的核心。隨著美國政府努力保持本國在全球人工智能競爭中的領(lǐng)先地位,它正在試圖對能出售給中國以及其他競爭對手的高性能芯片施加限制。
可如今,DeepSeek大模型的表現(xiàn)讓人們對美國政府貿(mào)易限制的意外后果產(chǎn)生了質(zhì)疑。
DeepSeek聊天機(jī)器人能回答問題、解決邏輯問題,并編寫自己的計(jì)算機(jī)程序,其能力不亞于市場上已有的任何產(chǎn)品。關(guān)鍵在于,其造價(jià)非常低,打破了只有最大的科技企業(yè)(全都在美國)才能制造出最先進(jìn)的人工智能系統(tǒng)的普遍觀念。
根據(jù)中國工程師的說法,他們只花了約600萬美元的原始計(jì)算能力就訓(xùn)練了新模型,不到科技巨頭Meta訓(xùn)練其最新人工智能模型所耗資金的十分之一。
喬治華盛頓大學(xué)專門研究新興技術(shù)和國際關(guān)系的助理教授杰弗里·丁(音)表示,中國進(jìn)口芯片受到限制,迫使DeepSeek工程師“更有效地訓(xùn)練大模型,以讓其仍有競爭力”。
多倫多的技術(shù)顧問魯文·科恩從去年12月下旬起一直在使用DeepSeek-V3。他說,該模型與OpenAI、谷歌,以及舊金山初創(chuàng)公司Anthropic的最新系統(tǒng)能力相當(dāng),而且使用起來便宜得多。
“DeepSeek是讓我省錢的辦法,”他說,“這正是像我這樣的人想使用的技術(shù)?!?
“深度求索的誕生,說明了為什么特朗普很難打贏貿(mào)易戰(zhàn)。”1月9日,美國喬治梅森大學(xué)經(jīng)濟(jì)系教授泰勒·考恩在彭博社刊文稱,由于美國限制對華出口芯片,深度求索等中企無法獲得最新的尖端芯片,因此不得不尋找其他更便宜的方法來訓(xùn)練其模型,并“間接導(dǎo)致了中國重要?jiǎng)?chuàng)新的出現(xiàn)”。
1月23日,英媒《金融時(shí)報(bào)》刊文《深度求索等中國初創(chuàng)企業(yè)正在挑戰(zhàn)全球AI巨頭》,同樣對深度求索給予高度評價(jià)。
美國南加州大學(xué)古爾德法學(xué)院法學(xué)教授張湖月(Angela Zhang)在文中提到,深度求索并非孤例。自去年年中以來,阿里巴巴、騰訊、字節(jié)跳動(dòng)等中國科技公司一直在穩(wěn)扎穩(wěn)打,逐步縮小與美國同行的差距,在能力上與他們匹敵,在成本效率上超越他們。
“中國在效率方面的成就并非偶然。這是中國對美國及其盟友不斷升級的出口限制的直接回應(yīng)。”張湖月認(rèn)為,“美國限制中國獲取先進(jìn)的AI芯片,卻無意中刺激了中國的創(chuàng)新。”
文章稱,這同時(shí)暴露了美國旨在阻礙中國AI發(fā)展的出口管制的局限性。雖然這些措施可能會(huì)造成短期干擾,但隨著中國不斷創(chuàng)新以適應(yīng),其影響只會(huì)逐漸減弱。
“對于美國政策制定者來說,一個(gè)難以接受的事實(shí)是,嚴(yán)格的出口管制迫使中國科技公司變得更加自力更生,從而推動(dòng)了原本可能不會(huì)發(fā)生的突破?!蔽恼氯绱藢懙?。
“深度求索的崛起生動(dòng)地提醒我們,限制可以促進(jìn)創(chuàng)新?!蔽恼伦詈笙蛎绹岢鲆蓡?,“對于特朗普的新政府來說,這提出了一個(gè)令人不安的問題:對中國實(shí)施越來越嚴(yán)厲的制裁是否會(huì)適得其反,加速他們原本想要壓制的進(jìn)步?”
“深度求索的誕生,說明了為什么特朗普很難打贏貿(mào)易戰(zhàn)?!?
1月9日,美國喬治梅森大學(xué)經(jīng)濟(jì)系教授泰勒·考恩也在彭博社刊文稱,由于美國限制對華出口芯片,深度求索等中企無法獲得最新的尖端芯片,因此不得不尋找其他更便宜的方法來訓(xùn)練其模型,并“間接導(dǎo)致了中國重要?jiǎng)?chuàng)新的出現(xiàn)”。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 劉程輝 
-
王星案重要犯罪嫌疑人“顏十六”到案
2025-01-26 22:45 打擊網(wǎng)絡(luò)詐騙 -
“瘋狂第一周,美企跟不上趟”
2025-01-26 22:33 應(yīng)對特朗普沖擊波 -
特朗普大嘴一張,就要決定150萬加沙人的命運(yùn)
2025-01-26 21:39 應(yīng)對特朗普沖擊波 -
“兩國已統(tǒng)一戰(zhàn)線”
2025-01-26 19:17 應(yīng)對特朗普沖擊波 -
“不遠(yuǎn)的將來,美國可能大幅擴(kuò)張,想想就美”
2025-01-26 18:40 美國一夢 -
首次,尹錫悅因涉內(nèi)亂罪被逮捕起訴
2025-01-26 18:07 三八線之南 -
加防長外長站臺(tái),他有望接替特魯多?
2025-01-26 15:23 觀察者頭條 -
現(xiàn)場證據(jù)來了!菲律賓登鐵線礁被我海警攔下
2025-01-26 14:24 南海局勢 -
白俄羅斯舉行總統(tǒng)選舉
2025-01-26 14:09 -
“睜著眼睛說瞎話”“三六九等”…外交部又有“神翻譯”
2025-01-26 13:39 -
匈牙利外長:索羅斯的代理人很難理解這一點(diǎn)
2025-01-26 11:57 歐洲亂局 -
“歐盟也應(yīng)在格陵蘭島駐軍”,他眼紅美國又扯中俄
2025-01-26 11:41 歐洲亂局 -
“德國大選決定歐洲命運(yùn)”
2025-01-26 11:33 德意志 -
敏昂萊最新表態(tài):感謝中國的堅(jiān)定支持
2025-01-26 10:16 緬甸局勢 -
中國駐以大使:中國沒有“反猶”土壤,真誠希望以巴和平共存
2025-01-26 10:14 -
特朗普稱美國可能重回WHO,又扯到中國…
2025-01-26 10:06 應(yīng)對特朗普沖擊波 -
澤連斯基“急了”:只有烏克蘭參與...
2025-01-26 09:37 烏克蘭之殤 -
美國新防長剛宣誓,立馬想“對抗中國”
2025-01-26 09:12 觀察者頭條 -
美個(gè)別議員再拋所謂“香港制裁法案”,中方駁斥
2025-01-26 08:58 香港 -
援以2000磅重炸彈被解禁!特朗普:拜登不給,我來給
2025-01-26 08:36 美國政治
相關(guān)推薦 -
-
最新聞 Hot
-
歐盟多國大停電,“我們需要中國技術(shù)”
-
普京閱兵式演講,特別提到中國
-
“對華閹割版,又要降級”
-
“全球都將研究,中國與西方最強(qiáng)大武器直接對決”
-
英方拿到了,“簡直像在平行宇宙,中國太超前了”
-
微軟:從中企學(xué)到,誰先一步拿下,誰就難被取代
-
美國農(nóng)民發(fā)愁:雞爪、魚頭...除了中國,好難找到買家
-
首位“美國教皇”利奧十四世是誰?
-
許紅兵,主動(dòng)投案
-
美國官員:殲-10擊落陣風(fēng),沒用F-16
-
特朗普:對華關(guān)稅145%到頂了,要降
-
美大使污蔑“中國不是好盟友”,我駐巴拿馬使館駁斥
-
印度稱軍事基地遭巴基斯坦襲擊,巴方否認(rèn)
-
特朗普:可能找中國幫忙
-
大搞家庭式腐敗,甘肅省原副省長趙金云被決定逮捕
-
蓋茨怒懟:馬斯克就是在殺死兒童
-