阿里千问3系列发布并开源:称成本大幅下降,性能超越DeepSeek-R1
2025年04月29日 11:07
来源: 澎湃新闻
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈


K图 BABA_0


K图 09988_0

  备受期待的千问3.0在五一节前面世。

  4月29日凌晨,阿里巴巴宣布开源新一代通义千问模型Qwen3(简称千问3),包含2款参数规模分别为30B和235B的混合专家(MoE)模型,以及大小从0.6B到32B的6款密集模型。据介绍,千问3模型家族是国内首个混合推理模型系列,235B模型的参数量仅为DeepSeek-R1的三分之一,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。

  在本次开源的系列模型中,旗舰模型Qwen3-235B-A22B的总参数量为235B,激活仅需22B。千问3预训练数据量达到36T,和千问2.5相比翻了两倍,并在后训练阶段进行多轮强化学习,将非思考模式整合到思考模型中。同时,千问3的部署成本大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

  在推理、指令遵循、工具调用、多语言能力等方面,千问3的性能均大幅增强:在奥数水平的AIME25测评中,千问3以81.5分的成绩刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3的表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3的分数超越了OpenAI-o1和DeepSeek-R1。

  千问3旗舰版和32B版本在部分基准测试中的得分。来源:通义千问

  为了迎接智能体Agent和大模型应用的集中爆发,千问3也在这方面提供了支持。在评估模型Agent能力的BFCL评测中,千问3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型。同时,千问3原生支持MCP(模型上下文协议),并具备强大的工具调用(function calling)能力,将大大降低编码复杂性。

  对于开发者而言,千问3酝酿已久的发布为开源领域带来新的动力。和前代一样,千问3系列模型依旧采用宽松的Apache2.0协议开源,首次支持119多种语言,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,或通过阿里云百炼调用千问3的API服务。个人用户可立即通过通义APP直接体验,夸克也即将全线接入千问3。

  有业内人士在经过实测后指出,千问3在逻辑推理、写作等方面的表现都不错,在生成复杂代码、数学推理等方面,思考模式的表现明显好于非思考模式。通义千问团队表示,未来计划从多个维度提升模型,以实现几个关键目标,包括扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围、推进强化学习以进行长周期推理。

  今年以来,通义千问团队表现活跃,先后开源发布旗舰模型Qwen2.5-Max、推理模型QwQ-32B和首个全模态大模型Qwen2.5-Omni。目前,阿里通义已开源200余个模型,全球下载量超3亿次;千问衍生模型数超10万个,已超越美国Llama,成为全球第一开源模型。

(文章来源:澎湃新闻)

文章来源:澎湃新闻 责任编辑:65
原标题:阿里千问3系列发布并开源:称成本大幅下降,性能超越DeepSeek-R1
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500