-
小米首個推理大模型開源
4月30日,小米在微信公眾號發(fā)布,小米開源首個為推理而生的大模型——Xiaomi MiMo。
據(jù)小米公開的數(shù)據(jù)顯示,在數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo僅用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview。
在相同RL訓(xùn)練數(shù)據(jù)情況下,MiMo-7B的數(shù)學(xué)&代碼領(lǐng)域的強(qiáng)化學(xué)習(xí)潛力顯著領(lǐng)先,分?jǐn)?shù)超過DeepSeek-R1-Distill和Qwen2.5-32B。
同時,預(yù)訓(xùn)練和后訓(xùn)練階段中數(shù)據(jù)和算法等多層面的創(chuàng)新聯(lián)動驅(qū)動,推動MiMo推理能力提升。其預(yù)訓(xùn)練的核心是讓模型見過更多推理模式,后訓(xùn)練的核心是高效穩(wěn)定的強(qiáng)化學(xué)習(xí)算法和框架。
目前,MiMo-7B已開源4個模型至HuggingFace。
小米介紹,MiMo是公司新成立的“小米大模型Core團(tuán)隊”的初步嘗試,并稱“2025年雖看似是大模型逐夢的后半程,但我們堅信AGI的征途仍漫長。”
去年4月,小米宣布組建AI實(shí)驗(yàn)室大模型團(tuán)隊,AI領(lǐng)域相關(guān)研發(fā)人員超1200人。去年12月,有消息稱小米正在著手搭建自己的GPU萬卡集群,將對AI大模型大力投入。傳言稱,小米大模型團(tuán)隊在成立時已有6500張GPU資源。
受此消息提振,截至午間休市,小米集團(tuán)當(dāng)天股價上漲4.74%,總市值1.29萬億港元(約合人民幣1.21萬億元)。
前天,阿里發(fā)布了新一代通義千問模型Qwen3(千問3)并進(jìn)行開源,登頂全球最強(qiáng)開源模型。騰訊在同日宣布將對其混元大模型研發(fā)體系進(jìn)行重組,加碼研發(fā)投入。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 楊依婷 
-
中高端男士不夠用了?報喜鳥凈利暴跌三成
2025-05-02 10:44 觀網(wǎng)財經(jīng)-消費(fèi) -
“淘寶閃購加碼即時零售,或與京東、美團(tuán)爭奪份額”
2025-05-01 14:54 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
-
茶咖日報|郭謹(jǐn)一卸任瑞幸咖啡董事長;星巴克中國二季報亮眼
2025-04-30 19:58 觀網(wǎng)財經(jīng)-消費(fèi) -
不內(nèi)卷,“90后”開的中國工廠靠什么脫穎而出?
2025-04-30 17:48 -
三星芯片業(yè)務(wù)利潤暴跌:美對華管制正損害業(yè)務(wù)
2025-04-30 15:51 觀網(wǎng)財經(jīng)-科創(chuàng) -
魅族新機(jī)撞臉華為三折疊,將搭載國產(chǎn)5G芯?
2025-04-30 15:39 觀網(wǎng)財經(jīng)-科創(chuàng) -
迪卡儂再被傳出售中國業(yè)務(wù)部分股權(quán)
2025-04-30 15:26 -
盒馬最新報告:東北燒烤最受追捧的前10個城市,南方占了8個
2025-04-30 14:46 觀網(wǎng)財經(jīng)-消費(fèi) -
Q1營收同比增20.6%,美的海外何以依舊高增長?
2025-04-30 14:18 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
“小時達(dá)”升級為“淘寶閃購”,阿里再度加碼即時零售
2025-04-30 13:32 今日財經(jīng) -
凈利率2%的量販零食,讓鳴鳴很忙在縣城實(shí)現(xiàn)雙贏
2025-04-30 10:36 觀網(wǎng)財經(jīng)-消費(fèi) -
加碼“餓補(bǔ)超百億”,餓了么殺入!
2025-04-30 10:26 觀網(wǎng)財經(jīng)-消費(fèi) -
國產(chǎn)直屏+驍龍芯,起售價相同,iQOO和紅米卷起來了
2025-04-30 10:04 觀網(wǎng)財經(jīng)-科創(chuàng) -
-
韋爾股份一季度凈利潤增長55%,CIS芯片獲國產(chǎn)高端手機(jī)采用
2025-04-30 07:40 觀網(wǎng)財經(jīng)-科創(chuàng) -
五大行同時公告:將不再設(shè)立監(jiān)事會
2025-04-29 21:21 金融觀察 -
劉強(qiáng)東老家力挺京東外賣,宿遷餐飲行業(yè)發(fā)文倡議
2025-04-29 19:36 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
央行召開落實(shí)金融“五篇大文章”總體統(tǒng)計制度動員部署會議
2025-04-29 17:51 金融觀察 -
通義全面上線阿里“最強(qiáng)開源模型”
2025-04-29 16:32 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng)
相關(guān)推薦 -
最新聞 Hot
-
普京閱兵式演講:絕不接受歪曲歷史
-
“對華閹割版,又要降級”
-
“全球都將研究,中國與西方最強(qiáng)大武器直接對決”
-
英方拿到了,“簡直像在平行宇宙,中國太超前了”
-
微軟:從中企學(xué)到,誰先一步拿下,誰就難被取代
-
美國農(nóng)民發(fā)愁:雞爪、魚頭...除了中國,好難找到買家
-
首位“美國教皇”利奧十四世是誰?
-
許紅兵,主動投案
-
美國官員:殲-10擊落陣風(fēng),沒用F-16
-
特朗普:對華關(guān)稅145%到頂了,要降
-
美大使污蔑“中國不是好盟友”,我駐巴拿馬使館駁斥
-
印度稱軍事基地遭巴基斯坦襲擊,巴方否認(rèn)
-
特朗普:可能找中國幫忙
-
大搞家庭式腐敗,甘肅省原副省長趙金云被決定逮捕
-
蓋茨怒懟:馬斯克就是在殺死兒童
-
微軟總裁瞎操心:不讓員工用DeepSeek
-