-
阿里云發(fā)布QwQ-32B:僅用1/20參數(shù)比肩滿血DS-R1,可在消費(fèi)級(jí)顯卡部署
-
連政guanchazhewanxgun
最后更新: 2025-03-06 11:42:483月6日凌晨,阿里云發(fā)布并開(kāi)源全新的推理模型通義千問(wèn)QwQ-32B。官方稱,這個(gè)新模型僅僅擁有320億參數(shù),但在性能上比肩6710億參數(shù)的滿血版DeepSeek R1。
目前,阿里云并未發(fā)布還完整技術(shù)報(bào)告,但官方數(shù)據(jù)顯示,QwQ-32B僅在編程競(jìng)賽(LiveCodeBench)和美國(guó)數(shù)學(xué)競(jìng)賽(AIME24)兩項(xiàng)略遜于滿血的DeepSeek-R1,其余三項(xiàng)則全面超越。此外更是碾壓完全超越了OpenAI-o1-mini。
阿里云解釋稱,團(tuán)隊(duì)此次基于Qwen2.5-32B模型,探索了擴(kuò)展強(qiáng)化學(xué)習(xí)(RL)的技術(shù)方案,并發(fā)現(xiàn)強(qiáng)化學(xué)習(xí)訓(xùn)練能夠持續(xù)提升模型性能,尤其在數(shù)學(xué)與編程任務(wù)中表現(xiàn)顯著。該團(tuán)隊(duì)還提到,通過(guò)持續(xù)擴(kuò)展強(qiáng)化學(xué)習(xí)訓(xùn)練的規(guī)模,中型模型也可以實(shí)現(xiàn)與巨型混合專(zhuān)家模型(MoE)相媲美的性能。
此外,QwQ-32B還滿足更低的資源消耗需求,適合快速響應(yīng)或?qū)?shù)據(jù)安全要求高的應(yīng)用場(chǎng)景,開(kāi)發(fā)者和企業(yè)可以在消費(fèi)級(jí)顯卡上將其部署到本地設(shè)備中,進(jìn)一步打造高度定制化的AI解決方案。阿里稱,QwQ-32B已多個(gè)平臺(tái)基于寬松的Apache2.0協(xié)議開(kāi)源,所有人都可免費(fèi)下載模型進(jìn)行本地部署,或者通過(guò)阿里云百煉平臺(tái)直接調(diào)用模型API服務(wù)。
值得一提的是,此前OpenAI曾因遇到技術(shù)瓶頸,將原來(lái)的GPT5.0降格為GPT4.5進(jìn)行發(fā)布,之后還透露將降低強(qiáng)化學(xué)習(xí)訓(xùn)練的優(yōu)先級(jí),轉(zhuǎn)向監(jiān)督學(xué)習(xí)(SSL)和語(yǔ)言模型(LM)為核心的技術(shù)路線。而QwQ-32B的發(fā)布則證明了強(qiáng)化學(xué)習(xí)路線仍有潛力,可以繼續(xù)提升模型的性能。
千問(wèn)QwQ-32B模型中還集成了與智能體Agent相關(guān)的能力,使其能夠在使用工具的同時(shí)進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過(guò)程。通義團(tuán)隊(duì)表示,未來(lái)將繼續(xù)探索將智能體與強(qiáng)化學(xué)習(xí)的集成,以實(shí)現(xiàn)長(zhǎng)時(shí)推理,探索更高智能進(jìn)而最終實(shí)現(xiàn)AGI的目標(biāo)。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 連政 
-
算力版圖的國(guó)運(yùn)賭局
2025-03-06 10:28 -
今年政府債務(wù)增加2.9萬(wàn)億,都用在哪?
2025-03-05 21:26 2025兩會(huì) -
烘培、燒烤、麻辣燙……海底撈“副牌”狂奔
2025-03-05 19:01 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
-
大模型工具Ollama存在安全隱患,本地部署Deepseek需小心
2025-03-05 17:30 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
-
追趕騰訊!字節(jié)跳動(dòng)最新估值3150億美元
2025-03-05 17:25 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
-
-
-
年薪250萬(wàn)的CFO離職,舍得酒業(yè)人事頻繁動(dòng)蕩
2025-03-05 17:16 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
使用騰訊元寶將被迫授予文章使用權(quán)?官方回應(yīng)
2025-03-05 17:05 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
李云澤表態(tài)拉長(zhǎng)穩(wěn)樓市白名單,專(zhuān)家:有助增強(qiáng)民企投資信心
2025-03-05 16:19 2025兩會(huì) -
-
-
巴展觀察:華為傳音展示三折疊,聯(lián)想太陽(yáng)能PC亮相
2025-03-05 13:26 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
國(guó)產(chǎn)視頻模型企業(yè)愛(ài)詩(shī)科技再獲億級(jí)融資,曾靠“毒液”視頻出圈
2025-03-05 12:56
相關(guān)推薦 -
-
真急了!“請(qǐng)求中國(guó)取消限制” 評(píng)論 65歐盟多國(guó)大停電,“我們需要中國(guó)技術(shù)” 評(píng)論 110中俄元首在主觀禮臺(tái)出席紅場(chǎng)閱兵式 評(píng)論 57英方拿到了,“簡(jiǎn)直像在平行宇宙,中國(guó)太超前了” 評(píng)論 88“全球都將研究,中國(guó)與西方最強(qiáng)大武器直接對(duì)決” 評(píng)論 390最新聞 Hot
-
真急了!“請(qǐng)求中國(guó)取消限制”
-
嚴(yán)管執(zhí)行!中方再出手,美媒發(fā)愁
-
俄副總理:中俄“西伯利亞力量-2”項(xiàng)目談判取得進(jìn)展
-
“歐洲在華企業(yè)偷著樂(lè):機(jī)會(huì)來(lái)了”
-
歐盟多國(guó)大停電,“我們需要中國(guó)技術(shù)”
-
普京閱兵式演講,特別提到中國(guó)
-
“對(duì)華閹割版,又要降級(jí)”
-
“全球都將研究,中國(guó)與西方最強(qiáng)大武器直接對(duì)決”
-
英方拿到了,“簡(jiǎn)直像在平行宇宙,中國(guó)太超前了”
-
微軟:從中企學(xué)到,誰(shuí)先一步拿下,誰(shuí)就難被取代
-
美國(guó)農(nóng)民發(fā)愁:雞爪、魚(yú)頭...除了中國(guó),好難找到買(mǎi)家
-
首位“美國(guó)教皇”利奧十四世是誰(shuí)?
-
許紅兵,主動(dòng)投案
-
美國(guó)官員:殲-10擊落陣風(fēng),沒(méi)用F-16
-
特朗普:對(duì)華關(guān)稅145%到頂了,要降
-
美大使污蔑“中國(guó)不是好盟友”,我駐巴拿馬使館駁斥
-