阿里千问3性能超越DeepSeek-R1,成本仅需三分之一

银柿财经 田子木 2025-04-29 09:54:14

4月29日,阿里巴巴开源新一代通义千问模型千问3登顶全球最强开源模型。

4月29日,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3)登顶全球最强开源模型,参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1。

据悉,千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T ,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。

千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,创下性能新高:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3性能图

千问3还提供了丰富的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斩获同尺寸开源模型SOTA(最佳性能):千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能;千问3的稠密模型性能继续突破,一半的参数量可实现同样的高性能,如32B版本的千问3模型可跨级超越Qwen2.5-72B性能。

同时,所有千问3模型都是混合推理模型,API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,灵活满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型是手机端的绝佳尺寸;8B可在电脑和汽车端侧部署应用;32B最受企业大规模部署欢迎,有条件的开发者也可轻松上手。

Qwen3开源模型家族

千问3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中,千问3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等模型,将大幅降低Agent调用工具的门槛。同时,千问3原生支持MCP协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent 框架,将大大降低编码复杂性,实现高效的手机及电脑Agent操作。

据了解,千问3系列模型依旧采用宽松的Apache2.0协议开源,并首次支持119多种语言,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,也可以通过阿里云百炼调用千问3的API服务。个人用户可通过通义APP直接体验千问3,夸克也即将全线接入千问3。

截止目前,阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,已超越美国Llama,成为全球第一开源模型。

(编辑:邵曰义)
实时资讯
更多
2025-04-29 21:24
苏宁易购一季度盈利,门店销售收入同比增19.3%
2025-04-29 20:54
横琴口岸预计2025年10月实现“免出示证件”便捷通关
2025-04-29 20:14
外交部:美方应在平等、尊重和互惠的基础上同中方开展对话
2025-04-29 20:10
4月29日龙虎榜解析:利欧股份当日净买入额最多
2025-04-29 19:27
交通运输部:全力确保“五一”假期交通运输安全平稳有序
2025-04-29 19:23
农业农村部:持续调整优化生猪产能
2025-04-29 19:20
新华保险:拟与中国人寿合计出资200亿元认购私募基金份额
2025-04-29 19:19
4月29日南向资金全天净卖出64.24亿港元
2025-04-29 17:59
乘联分会崔东树:2025年1~3月中国占世界汽车份额33%
2025-04-29 17:53
神舟十九号载人飞船因东风着陆场气象原因推迟返回
2025-04-29 17:00
中国金融期货交易所:增加30年期国债期货合约可交割国债
2025-04-29 16:58
*ST旭蓝:股票已被深交所决定终止上市 将于4月30日被摘牌
2025-04-29 16:56
2024年快手电商宠物行业GMV同比增长53%
2025-04-29 16:55
市场监管总局:查办涉民营企业商标品牌案件1.2万件,涉案金额2.7亿元
2025-04-29 16:52
人社部:截至3月底全国基本养老保险基金委托投资规模2.4万亿元
2025-04-29 16:42
2025年私募合规系列培训班(北京场)举办
2025-04-29 16:41
习近平访问金砖国家新开发银行
2025-04-29 16:41
习近平在上海考察时强调 加快建成具有全球影响力的科技创新高地
2025-04-29 16:34
百亿级私募一季度加仓科技与医药板块
2025-04-29 16:27
中基协:截至3月底公募基金资产净值达32.22万亿元
2025-04-29 21:24
苏宁易购一季度盈利,门店销售收入同比增19.3%
2025-04-29 20:54
横琴口岸预计2025年10月实现“免出示证件”便捷通关
2025-04-29 20:14
外交部:美方应在平等、尊重和互惠的基础上同中方开展对话
2025-04-29 20:10
4月29日龙虎榜解析:利欧股份当日净买入额最多
2025-04-29 19:27
交通运输部:全力确保“五一”假期交通运输安全平稳有序
2025-04-29 19:23
农业农村部:持续调整优化生猪产能
2025-04-29 19:20
新华保险:拟与中国人寿合计出资200亿元认购私募基金份额
2025-04-29 19:19
4月29日南向资金全天净卖出64.24亿港元
2025-04-29 17:59
乘联分会崔东树:2025年1~3月中国占世界汽车份额33%
2025-04-29 17:53
神舟十九号载人飞船因东风着陆场气象原因推迟返回
2025-04-29 17:00
中国金融期货交易所:增加30年期国债期货合约可交割国债
2025-04-29 16:58
*ST旭蓝:股票已被深交所决定终止上市 将于4月30日被摘牌
2025-04-29 16:56
2024年快手电商宠物行业GMV同比增长53%
2025-04-29 16:55
市场监管总局:查办涉民营企业商标品牌案件1.2万件,涉案金额2.7亿元
2025-04-29 16:52
人社部:截至3月底全国基本养老保险基金委托投资规模2.4万亿元
2025-04-29 16:42
2025年私募合规系列培训班(北京场)举办
2025-04-29 16:41
习近平访问金砖国家新开发银行
2025-04-29 16:41
习近平在上海考察时强调 加快建成具有全球影响力的科技创新高地
2025-04-29 16:34
百亿级私募一季度加仓科技与医药板块
2025-04-29 16:27
中基协:截至3月底公募基金资产净值达32.22万亿元
热门文章
日排行 周排行
金力泰:无法在预约日期及预计无法在法定期限内披露定期报告
银柿财经 04-28
1
阿里千问3性能超越DeepSeek-R1,成本仅需三分之一
银柿财经 04-29
2
证券从业者能炒股了?业内:是误读,实为强化监管
银柿财经 04-29
3
财经早知道|发改委:针对长期摇号家庭和无车家庭,定向增发购车指标
银柿财经 04-29
4
汇洲智能被立案后一字跌停,受损投资者可报名维权
银柿财经 04-29
5
智元机器人彭志辉:感受到总书记对具身智能行业的高度重视和殷切关怀
银柿财经 04-29
6
社交电商收入同比增长49.4%,遥望科技发布首个内部AI应用框架
银柿财经 04-29
7
净利22.47亿,储能暴增500%!一图看懂阿特斯2024年报和2025年一季报
银柿财经 04-29
8
思创医惠剥离亏损业务,苍南国资“驰援”推动战略聚焦、资产优化
银柿财经 04-29
9
游戏板块国内国外双核驱动,世纪华通一季度净利润同比翻倍
银柿财经 04-29
10