-
中國團隊連獲國際大獎,“有助于對抗美國芯片禁令”
【文/觀察者網 熊超然】上個月,全球計算機存儲領域的頂級學術會議——第23屆USENIX文件與存儲技術會議(USENIX Conference on File and Storage Technologies,簡稱FAST),在美國加利福尼亞州圣克拉拉舉行。
本屆大會上,來自中國的人工智能(AI)初創(chuàng)公司月之暗面(Moonshot AI)和清華大學團隊合作發(fā)表論文并在其中提出一個名為Mooncake的系統(tǒng),因而獲得埃里克·里德爾最佳論文獎(Erik Riedel Best Paper Award)。
香港《南華早報》3月14日報道認為,Mooncake這一款大語言模型系統(tǒng)的效率比之前的基準提高了五倍,從而幫助降低了對計算資源的需求。在美國長期就中國獲取先進AI芯片進行圍堵打壓的背景下,這一成果還有助于對抗美國芯片禁令、減少對英偉達等企業(yè)出產的圖形處理單元(GPU)的依賴。
而在本月,無問芯穹(Infinigence AI)和上海交通大學、清華大學共同提出的視頻生成大模型推理IP工作——FlightVGM,也在國際頂級會議上獲獎。他們首次在可重構邏輯集成電路(FPGA)上實現了視頻生成模型(VGMs)的高效推理,在美國半導體公司AMD廣泛可用的V80 FPGA芯片上,該系統(tǒng)在性能上提升了30%,能效比英偉達旗艦產品RTX 3090 GPU高出4.5倍。
《南華早報》稱,中國AI科研團隊用工業(yè)芯片取代英偉達高端GPU而獲全球大獎,這預示著全球優(yōu)化AI硬件的競賽也出現了重大轉變。
埃里克·里德爾最佳論文獎 清華大學網站新聞圖
據報道,這篇獲獎論文由清華大學計算機系教師章明星、武永衛(wèi)、鄭緯民團隊和月之暗面公司合作發(fā)表,名為“以鍵值緩存為中心的以存換算大語言模型推理架構”(Mooncake: Trading More Storage for Less Computation-A KVCache-centric Architecture for Serving LLM Chatbot)。論文的第一作者為計算機系博士生秦若愚,導師為助理教授章明星。
根據清華大學方面的介紹,該論文提出的系統(tǒng)Mooncake,是月之暗面推出的大語言模型服務Kimi的底層推理服務平臺。Mooncake采用了一種以鍵值緩存(KVCache)為中心的分離架構,不僅將預填充和解碼集群分離,還高效利用了推理集群中未充分利用的CPU、DRAM、SSD和NIC資源,構建了一個獨立的KVCache緩存池。其核心創(chuàng)新在于以KVCache為中心的全局緩存和調度器,旨在嚴格延遲相關服務級別目標(SLOs)下最大化吞吐量。
實驗結果顯示,Mooncake在處理長上下文輸入的場景中表現出色。在使用真實數據進行的測試中,與基線方法相比,Mooncake在符合SLOs的情況下,將有效請求處理能力提升了59%至498%。目前,Mooncake已在數千個節(jié)點上運行,每日處理超過1000億個token。在實際部署中,Mooncake的創(chuàng)新架構使Kimi在NVIDIA A800和H800集群上分別比以前的系統(tǒng)多處理115%和107%的請求。
《南華早報》指出,一段時間以來,美國政府已對向中國出口先進AI芯片實施了一系列限制措施,包括對英偉達高端芯片的多項禁令。
英偉達的AI芯片在全球范圍內廣泛部署。 《華爾街日報》
早在2022年10月,美國政府就已實施了一系列AI芯片出口限制措施,英偉達由于無法向中國市場提供A100和H100這兩款AI處理器,專門為中國市場特供符合美方規(guī)定的A800和H800芯片,以繞開美國政府的管制。
2023年10月,美國商務部又發(fā)布了一系列新的芯片出口限制,擴大了對高級AI芯片的定義,并對運往40多個國家的芯片產品提出額外的許可要求,以避免轉售給中國。這一新的限制措施出臺,意味著A800和H800芯片也被列入禁售名單。
美方想方設法圍堵打壓,就是意圖限制中國在AI領域的計算能力,進而壓制AI模型的訓練和開發(fā)。然而,這些限制反而促使中方研究人員和企業(yè)尋求通過軟件優(yōu)化和創(chuàng)新數據結構來挖掘現有芯片潛力的方法。
據報道,清華大學MADSys實驗室已在軟件源代碼托管服務平臺GitHub上啟動了Mooncake項目,旨在加速該技術的采用和傳播。與此同時,該項目已被包括阿里巴巴和螞蟻集團在內的多家公司內部采用,并已融入開源社區(qū)。
- 責任編輯: 熊超然 
-
“不及中國1/200!”美國卷不動,日韓很興奮
2025-03-14 22:28 觀察者頭條 -
重大戰(zhàn)果:2255人被押解回國
2025-03-14 22:24 打擊網絡詐騙 -
特朗普:我跟普京聊過了,要他饒烏軍一命
2025-03-14 22:09 應對特朗普沖擊波 -
“美國拒絕了:還得改”
2025-03-14 21:41 烏克蘭之殤 -
升級!俄奪回三座城鎮(zhèn),烏稱擊退22次進攻
2025-03-14 21:12 烏克蘭之殤 -
“中方應該會歡迎?”
2025-03-14 21:05 中美關系 -
關稅狂飆美股跳水,“特朗普衰退”真要來了?
2025-03-14 18:37 特朗普 -
“同意但有條件”,普京聲明全文:感謝中印巴西南非
2025-03-14 18:05 烏克蘭之殤 -
普京提議與特朗普會談,中方表態(tài)
2025-03-14 16:19 烏克蘭之殤 -
就伊朗核問題,王毅提出五點主張
2025-03-14 16:04 伊朗局勢 -
美國肉商出口資質快到期了:很急,但中國沒回
2025-03-14 16:03 應對特朗普沖擊波 -
赤裸裸的權錢交易?特朗普家族被曝和幣安談入股
2025-03-14 15:47 -
特朗普:有計劃與金正恩重建關系
2025-03-14 15:17 -
不裝了!OpenAI上書特朗普:要對中國AI下死手
2025-03-14 14:20 人工智能 -
美國諾獎得主急了:攪吧攪吧!最后連高端制藥都得從中國買了
2025-03-14 14:12 應對特朗普沖擊波 -
中俄伊聯(lián)合聲明
2025-03-14 14:03 中國外交 -
伊朗核問題中俄伊北京會晤:三方強調終止所有非法單邊制裁的必要性
2025-03-14 13:53 -
北京會晤舉行,中俄伊交換意見
2025-03-14 11:57 中國外交 -
日本男女在長城上做不雅行為,被驅逐出境!
2025-03-14 11:44 中日關系 -
歐盟外長又來:美歐互咬,中國在笑
2025-03-14 11:43 觀察者頭條
相關推薦 -
歐盟多國大停電,“我們需要中國技術” 評論 98中俄元首在主觀禮臺出席紅場閱兵式 評論 57英方拿到了,“簡直像在平行宇宙,中國太超前了” 評論 86“全球都將研究,中國與西方最強大武器直接對決” 評論 390美國官員:殲-10擊落陣風,沒用F-16 評論 407最新聞 Hot
-
真急了!“請求中國取消限制”
-
嚴管執(zhí)行!中方再出手,美媒發(fā)愁
-
俄副總理:中俄“西伯利亞力量-2”項目談判取得進展
-
“歐洲在華企業(yè)偷著樂:機會來了”
-
歐盟多國大停電,“我們需要中國技術”
-
普京閱兵式演講,特別提到中國
-
“對華閹割版,又要降級”
-
“全球都將研究,中國與西方最強大武器直接對決”
-
英方拿到了,“簡直像在平行宇宙,中國太超前了”
-
微軟:從中企學到,誰先一步拿下,誰就難被取代
-
美國農民發(fā)愁:雞爪、魚頭...除了中國,好難找到買家
-
首位“美國教皇”利奧十四世是誰?
-
許紅兵,主動投案
-
美國官員:殲-10擊落陣風,沒用F-16
-
特朗普:對華關稅145%到頂了,要降
-
美大使污蔑“中國不是好盟友”,我駐巴拿馬使館駁斥
-