-
訊飛星火之后,螞蟻用國(guó)產(chǎn)芯片訓(xùn)練出2900億參數(shù)大模型
最后更新: 2025-03-24 18:53:073月24日,彭博社援引知情人士消息稱,螞蟻集團(tuán)已成功利用阿里巴巴、華為等國(guó)產(chǎn)芯片,結(jié)合混合專家(MoE)架構(gòu)訓(xùn)練出參數(shù)規(guī)模達(dá)2900億的大模型“Ling-Plus”,其性能與英偉達(dá)H800芯片訓(xùn)練的同類模型相當(dāng),且訓(xùn)練成本降低20%。這一突破是繼科大訊飛“星火大模型”之后,中國(guó)國(guó)產(chǎn)算力生態(tài)即將迎來(lái)的第二個(gè)標(biāo)志性大模型。
據(jù)螞蟻集團(tuán)Ling團(tuán)隊(duì)發(fā)布的論文,其自研的Ling系列模型通使用國(guó)產(chǎn)廠商(如壁仞科技、天數(shù)智芯、寒武紀(jì)等)的產(chǎn)品,訓(xùn)練1萬(wàn)億Token的成本從635萬(wàn)元降至508萬(wàn)元,降幅達(dá)20%,但模型性能仍可對(duì)標(biāo)阿里通義Qwen2.5-72B和DeepSeek-V2.5。
針對(duì)外媒(彭博社)關(guān)于螞蟻百靈大模型訓(xùn)練成本的報(bào)道,螞蟻方面回應(yīng)觀察者網(wǎng)稱:螞蟻針對(duì)不同芯片持續(xù)調(diào)優(yōu),以降低AI應(yīng)用成本,目前取得了一定的進(jìn)展,也會(huì)逐步通過(guò)開源分享。
除了自研性能領(lǐng)先的大模型以外,該技術(shù)論文最大的突破在于提出了一系列創(chuàng)新方法,以提升資源受限環(huán)境下AI開發(fā)的效率與可及性。實(shí)驗(yàn)表明,其3000億參數(shù)的MoE大模型可在使用國(guó)產(chǎn)GPU的低性能設(shè)備上完成高效訓(xùn)練,性能與完全使用英偉達(dá)芯片、同規(guī)模的稠密模型及MoE模型相當(dāng)。作為國(guó)內(nèi)較早布局AI大模型的廠商,螞蟻?zhàn)匝械陌凫`大模型2023年已通過(guò)備案,重點(diǎn)布局在生活服務(wù)、金融服務(wù)、醫(yī)療健康等場(chǎng)景的應(yīng)用。
在此之前,科大訊飛發(fā)布了首個(gè)基于全國(guó)產(chǎn)化算力平臺(tái)訓(xùn)練的全民開放大模型——訊飛星火V3.5。
本月,科大訊飛與華為聯(lián)合團(tuán)隊(duì)宣布,成功在昇騰國(guó)產(chǎn)算力集群上實(shí)現(xiàn)MoE模型的大規(guī)模跨節(jié)點(diǎn)專家并行推理。這是繼深度求索(DeepSeek)公開MoE訓(xùn)練方案后,業(yè)界首個(gè)完全基于國(guó)產(chǎn)算力的解決方案。
通過(guò)算子融合、混合并行策略和通信計(jì)算并行優(yōu)化等一系列創(chuàng)新,科大訊飛在國(guó)產(chǎn)算力上實(shí)現(xiàn)了顯著性能提升:?jiǎn)慰o態(tài)內(nèi)存占用縮減至雙機(jī)部署的1/4,效率提升75%,專家計(jì)算密度增加4倍,推理吞吐提升3.2倍,端到端時(shí)延降低50%。
基于此次科大訊飛攜手華為所做的首個(gè)基于國(guó)產(chǎn)算力的MoE模型訓(xùn)推方案,科大訊飛稱,這一突破性的解決方案也將應(yīng)用于訊飛星火深度推理模型的訓(xùn)練加速,預(yù)期訓(xùn)練時(shí)推理效率將提升200%。同時(shí),基于該方案的推理引擎也實(shí)現(xiàn)了國(guó)產(chǎn)算力上DeepSeek-V3和R1的高效推理。
科大訊飛“星火”驗(yàn)證了國(guó)產(chǎn)算力的可行性,螞蟻“Ling系列”則進(jìn)一步證明其規(guī)?;徒?jīng)濟(jì)性。隨著阿里、華為等巨頭加碼,中國(guó)AI產(chǎn)業(yè)正從“單點(diǎn)突破”轉(zhuǎn)向“生態(tài)協(xié)同”。這場(chǎng)算力平權(quán)運(yùn)動(dòng),或?qū)⒊蔀槿駻I競(jìng)賽的新變量。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 楊依婷 
-
京東外賣上線40天,日訂單首破百萬(wàn)
2025-03-24 18:12 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
宣布斥資15億布局香港后,京東要把家電價(jià)格打到全港最低
2025-03-24 18:12 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
2元的一根妙可藍(lán)多奶酪,去年又掙了1.13億
2025-03-24 17:34 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
途虎養(yǎng)車全網(wǎng)首發(fā)德國(guó)馬牌ExtremeContact XC7全新輪胎產(chǎn)品線
2025-03-24 17:26 -
控量挺價(jià)成效待考,舍得酒業(yè)2024年凈利驟降80%
2025-03-24 17:25 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
教培跑路頻發(fā),美團(tuán)這招行不行?
2025-03-24 17:24 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
2024年中國(guó)財(cái)政政策執(zhí)行情況報(bào)告發(fā)布
2025-03-24 16:23 -
-
五大芯片巨頭來(lái)華參會(huì),高通三星高管到訪小米汽車工廠
2025-03-24 11:44 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
中科院專家:RISC-V開辟中國(guó)芯片自主新賽道,還需攻克“三座大山”
2025-03-23 16:07 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
絲芙蘭迷失在中國(guó),全球CEO緊急“救火”
2025-03-23 09:39 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
華為楊超斌:已有超80家伙伴基于昇騰打造大模型一體機(jī)
2025-03-22 21:40 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
從鴻蒙手機(jī)到鴻蒙電腦,華為終端鴻蒙化提速
2025-03-22 08:40 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
消息稱盒馬醞釀新店型,布局“1店+N倉(cāng)”模式
2025-03-22 00:10 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
中美科技博弈下,233萬(wàn)用戶選擇把票投給“WPS鴻蒙版”
2025-03-21 23:59 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
嘉士伯控股重慶啤酒被指打壓民族品牌“山城”?真相沒那么簡(jiǎn)單
2025-03-21 21:08 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
蘋果AI被指控虛假宣傳
2025-03-21 20:59 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
相關(guān)推薦 -
“跟巴西建這條鐵路,中國(guó)非常感興趣” 評(píng)論 0真急了!“請(qǐng)求中國(guó)取消限制” 評(píng)論 418歐盟多國(guó)大停電,“我們需要中國(guó)技術(shù)” 評(píng)論 159中俄元首在主觀禮臺(tái)出席紅場(chǎng)閱兵式 評(píng)論 66英方拿到了,“簡(jiǎn)直像在平行宇宙,中國(guó)太超前了” 評(píng)論 98最新聞 Hot
-
“跟巴西建這條鐵路,中國(guó)非常感興趣”
-
巴基斯坦發(fā)起“銅墻鐵壁”行動(dòng):已打擊20多處印度軍事設(shè)施
-
克宮回應(yīng):支持30天?;穑猛咨瓢才拧凹?xì)節(jié)問(wèn)題”
-
特朗普:鮑威爾不愛我
-
“講真,印巴打仗我們管不著”
-
普京:welcome,盧卡申科:現(xiàn)在都用英語(yǔ)了?
-
X平臺(tái):印度要求封禁8000多個(gè)當(dāng)?shù)刭~戶,否則重罰
-
4月中國(guó)對(duì)東盟出口激增20.8%,美媒驚了
-
真急了!“請(qǐng)求中國(guó)取消限制”
-
嚴(yán)管執(zhí)行!中方再出手,美媒發(fā)愁
-
俄副總理:中俄“西伯利亞力量-2”項(xiàng)目談判取得進(jìn)展
-
“歐洲在華企業(yè)偷著樂(lè):機(jī)會(huì)來(lái)了”
-
歐盟多國(guó)大停電,“我們需要中國(guó)技術(shù)”
-
普京閱兵式演講,特別提到中國(guó)
-
“對(duì)華閹割版,又要降級(jí)”
-
“全球都將研究,中國(guó)與西方最強(qiáng)大武器直接對(duì)決”
-