国产精品亚洲综合色区,国产精品成人1区二区在线观看 ,av网站免费线看

APP下載

掃一掃

下載觀察者APP

阿里“最強(qiáng)開源模型”，昇騰、海光已適配
- 楊依婷
分享到：

2025-04-29 14:21:11 字號(hào)：A- A A+ 來源：觀察者網(wǎng)

最后更新: 2025-04-29 14:30:26

（文/楊依婷編輯/呂棟）

4月29日凌晨，阿里新一代通義千問模型Qwen3發(fā)布并開源，它的參數(shù)量?jī)H為DeepSeek-R1的1/3，但成本大幅下降，性能超越R1、OpenAI-o1等全球頂尖模型，被媒體稱為“全球最強(qiáng)開源模型”。

隨后，華為計(jì)算官方發(fā)文稱，此次Qwen3系列一經(jīng)發(fā)布開源，即在MindSpeed和MindIE中開箱即用，實(shí)現(xiàn)Qwen3的0Day適配。海光信息方面也表示，海光DCU迅速完成對(duì)全部8款模型的無縫適配+調(diào)優(yōu)。

根據(jù)阿里云官方信息，此次開源包括兩款MoE模型：Qwen3-235B-A22B（2350多億總參數(shù)、 220多億激活參），以及Qwen3-30B-A3B（300億總參數(shù)、30億激活參數(shù)）；以及六個(gè)Dense模型：Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中的旗艦?zāi)Ｐ蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中，與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級(jí)模型相比，表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果。

此外，小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%，表現(xiàn)更勝一籌，甚至像Qwen3-4B這樣的小模型也能匹敵Qwen2.5-72B-Instruct的性能。

Qwen3是國(guó)內(nèi)首個(gè)“混合推理模型”，模型支持兩種思考模式：思考模式：在這種模式下，模型會(huì)逐步推理，經(jīng)過深思熟慮后給出最終答案。這種方法適合需要深入思考的復(fù)雜問題。非思考模式：在此模式中，模型提供快速、近乎即時(shí)的響應(yīng)，適用于那些對(duì)速度要求高于深度的簡(jiǎn)單問題。

在預(yù)訓(xùn)練方面，Qwen3的數(shù)據(jù)集相比Qwen2.5有了顯著擴(kuò)展。Qwen2.5是在18萬(wàn)億個(gè)token上進(jìn)行預(yù)訓(xùn)練的，而Qwen3使用的數(shù)據(jù)量幾乎是其兩倍，達(dá)到了約36萬(wàn)億個(gè)token，涵蓋了119種語(yǔ)言和方言。

從官方數(shù)據(jù)來看，在考察代碼能力的LiveCodeBench評(píng)測(cè)中，Qwen3突破70分大關(guān)，表現(xiàn)甚至超過Grok3；在評(píng)估模型人類偏好對(duì)齊的ArenaHard的測(cè)評(píng)中，Qwen3分別以95.6分超越了OpenAI-o1及DeepSeek-R1；在評(píng)估奧數(shù)水平的AIME25測(cè)評(píng)中，Qwen3以81.5分刷新開源記錄。

Qwen3發(fā)布后，華為計(jì)算方面發(fā)文稱，此前昇騰MindSpeed和MindIE一直同步支持Qwen系列模型，此次Qwen3系列一經(jīng)發(fā)布開源，即在MindSpeed和MindIE中開箱即用，實(shí)現(xiàn)Qwen3的0Day適配。

隨后海光信息也表示，在“深算智能”戰(zhàn)略引領(lǐng)下，海光DCU迅速完成對(duì)全部8款模型的無縫適配+調(diào)優(yōu)，覆蓋235B/32B/30B/14B/8B/4B/1.7B/0.6B，實(shí)現(xiàn)零報(bào)錯(cuò)、零兼容性問題的秒級(jí)部署。

本文系觀察者網(wǎng)獨(dú)家稿件，未經(jīng)授權(quán)，不得轉(zhuǎn)載。
|

舉報(bào)
- 違反法律法規(guī)
- 垃圾信息、廣告
- 色情、淫穢信息
- 人身攻擊
- 謠言、不實(shí)信息
- 冒充，冒用信息
- 破壞社區(qū)秩序
- 其他
- 涉未成年人有害信息
觀察者網(wǎng)舉報(bào)制度規(guī)范
確定取消
標(biāo)簽華為 Qwen3
- 責(zé)任編輯: 楊依婷
搜索

   觀察者頭條查看全部

真急了！“請(qǐng)求中國(guó)取消限制” 評(píng)論 65

歐盟多國(guó)大停電，“我們需要中國(guó)技術(shù)” 評(píng)論 110

中俄元首在主觀禮臺(tái)出席紅場(chǎng)閱兵式評(píng)論 57

英方拿到了，“簡(jiǎn)直像在平行宇宙，中國(guó)太超前了” 評(píng)論 88

“全球都將研究，中國(guó)與西方最強(qiáng)大武器直接對(duì)決” 評(píng)論 390

   風(fēng)聞 · 24小時(shí)最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

97色成人综合网站,97色成人综合网站,高清freesexmovies性tv出水,大黑大巴大战欧洲美女图片,√天堂资源中文www

阿里“最強(qiáng)開源模型”，昇騰、海光已適配

美的格力隔空打架，誰(shuí)是“家用空調(diào)線上零售第一”？

特朗普發(fā)動(dòng)單邊貿(mào)易霸凌后，比交易更“藝術(shù)”的事情出現(xiàn)了…

向AI電商領(lǐng)域進(jìn)軍，ChatGPT搜索上線購(gòu)物推薦功能

阿里發(fā)布并開源模型Qwen3，成本僅為DeepSeek-R1的1/3

Qwen3性能超越DS-R1；曝馬斯克孩子遠(yuǎn)超14個(gè)；ChatGPT推出購(gòu)物功能

截至3月末，全國(guó)地方政府債務(wù)余額501650億元

茶咖日?qǐng)?bào)｜滬上阿姨5月8日起在港交所交易

最強(qiáng)“蘋”替？vivo稱備貨幾十萬(wàn)的新旗艦已缺貨

華為獨(dú)占近80%份額，折疊屏的戰(zhàn)爭(zhēng)結(jié)束了嗎？

Switch新機(jī)或?qū)⒚媾R高額關(guān)稅沖擊，消費(fèi)者擔(dān)憂價(jià)格上漲

加碼多模態(tài)能力，夸克發(fā)布全新“AI相機(jī)”

AIDC建設(shè)與國(guó)產(chǎn)替代加速，良信股份一季度營(yíng)利雙增

Kimi與財(cái)新傳媒達(dá)成內(nèi)容合作上線權(quán)威信源徽章認(rèn)證

美債下跌會(huì)否影響中國(guó)的美元資產(chǎn)收益？央行回應(yīng)

穩(wěn)健領(lǐng)跑，濱江集團(tuán)首進(jìn)全國(guó)前十

歐菲光一季度再虧5895萬(wàn)：手機(jī)汽車都卷，怎么辦？

寶馬中國(guó)宣布接入DS；美的人形機(jī)器人5月進(jìn)廠；哪吒2獲華表獎(jiǎng)特別貢獻(xiàn)影片

五糧液2024年?duì)I收近900億元，毛利率超82%

超越DeepSeek，中國(guó)開源“集團(tuán)軍”重塑全球AI生態(tài)

“落寞網(wǎng)紅”綠茶，為IPO愛上下沉市場(chǎng)

真急了！“請(qǐng)求中國(guó)取消限制”

嚴(yán)管執(zhí)行！中方再出手，美媒發(fā)愁

俄副總理：中俄“西伯利亞力量-2”項(xiàng)目談判取得進(jìn)展

“歐洲在華企業(yè)偷著樂：機(jī)會(huì)來了”

歐盟多國(guó)大停電，“我們需要中國(guó)技術(shù)”

普京閱兵式演講，特別提到中國(guó)

“對(duì)華閹割版，又要降級(jí)”

“全球都將研究，中國(guó)與西方最強(qiáng)大武器直接對(duì)決”

英方拿到了，“簡(jiǎn)直像在平行宇宙，中國(guó)太超前了”

微軟：從中企學(xué)到，誰(shuí)先一步拿下，誰(shuí)就難被取代

美國(guó)農(nóng)民發(fā)愁：雞爪、魚頭...除了中國(guó)，好難找到買家

首位“美國(guó)教皇”利奧十四世是誰(shuí)？

許紅兵，主動(dòng)投案

美國(guó)官員：殲-10擊落陣風(fēng)，沒用F-16

特朗普：對(duì)華關(guān)稅145%到頂了，要降

美大使污蔑“中國(guó)不是好盟友”，我駐巴拿馬使館駁斥

阿里“最強(qiáng)開源模型”，昇騰、海光已適配

阿里“最強(qiáng)開源模型”，昇騰、海光已適配