国产大模型又有重磅!阿里发布通义千问旗舰版模型,采用开源策略
2025年01月30日 16:33
来源: 红星资本局
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  红星资本局1月30日消息,据“阿里云”微信公众号,1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max全新升级发布。

  据介绍,Qwen2.5-Max模型是阿里云通义团队对MoE(混合专家)模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分。这是继DeepSeek之后又一国产AI大模型,且同样是开源模型。

阿里云发布新AI大模型

阿里美股大涨

  阿里云通义团队将Qwen2.5-Max与目前领先的开源MoE模型DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。在测试大学水平知识的MMLU-Pro、评估编程能力的LiveCodeBench、综合能力评估的LiveBench,以及近似人类偏好的Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至领先的性能。

  1月28日,阿里还开源了全新的视觉理解模型Qwen2.5-VL,推出了3B、7B、72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。

  值得一提的是,阿里云是今年总台春晚云计算AI独家合作伙伴,主要为春晚提供两部分技术支持:一是阿里云云转播技术支持全球华人云上看春晚,二是阿里云通义大模型技术支持春晚节目创新,创造全新的视听效果。

  受新模型的影响,阿里巴巴(BABA.US)当天的股价一度涨超7%,收涨6.71%;1月29日盘中再度大涨,收涨0.71%,报96.715美元。

采用开源模型策略

  不同于OpenAI等多数大模型厂商采取的闭源策略,阿里云、Meta(脸书母公司)和DeepSeek采用的都是开源策略。

  DeepSeek发布的DeepSeek-R1模型,以较低成本实现与OpenAI开发的GPT-o1相当的性能,引发市场对AI硬件需求的担忧,英伟达半导体板块暴跌。DeepSeek的成功也被认为是开源模型的胜利。

  图灵奖得主、Meta首席人工智能科学家杨立昆(Yann LeCun)此前表示,DeepSeek成功的正确解读应是“开源模型正超越专有模型”。

  “DeepSeek从开放研究和开源获益良多,他们提出新想法,并基于其他人的工作进行创新。”杨立昆表示,“由于他们的工作是公开和开源的,所有人都能从中获益。这就是开源研究和开源技术的力量。”

  阿里集团CEO吴泳铭曾表示:“通义的开源模型在中文世界的开发者使用广泛,当开发者使用阿里云的开源模型,需要把应用部署到线上的时候,就会自然而然地选用阿里云的服务。”

  1月29日,MetaCEO马克·扎克伯格在财报后电话会上表示,在开源领域,一家公司的进步最终会使其他公司都受益,Meta也将持续发布自己的免费开源模型Llama系列。

  红星新闻记者吴丹若

(文章来源:红星资本局)

文章来源:红星资本局 责任编辑:6
原标题:国产大模型又有重磅!阿里发布通义千问旗舰版模型,采用开源策略
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500