混元Hy3“杀疯了”，腾讯AI大模型下半场排位赛迎来高光

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

混元Hy3“杀疯了”，腾讯AI大模型下半场排位赛迎来高光

2026年05月07日 21:04

来源： 21世纪经济报道

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　5月7日，在全球最大的API聚合平台OpenRouter公布的周榜上，腾讯最新语言模型混元Hy3 preview的Token（词元）调用量与市场占有率双双登顶。腾讯方面同日披露，上线两周，这款新模型的调用量已超过其上一代Hy2的10倍，在自家CodeBuddy、WorkBuddy等智能体应用中Token调用量高涨16.5倍。两份来之不易的成绩，成为过去一年腾讯AI叙事中少有的高光，同日腾讯股价大涨超3%。

　　此前在4月23日，腾讯发布并开源混元Hy3 preview模型，将其称之为“混元重建后训练的第一个模型”，也是混元迄今最智能的模型。Hy3 preview是一个快慢思考融合的MoE（混合专家）架构模型，总参数295B，激活参数21B，最大支持256K上下文长度，提升的方向包括复杂推理、指令遵循、上下文学习、代码、改进工具使用和规划能力等。

　　内驱动力重构

　　Hy3 preview也是姚顺雨上任后混元大模型首次重大更新，模型发布当天，姚顺雨在社交媒体上写道，腾讯的目标是做出超越公开榜单、具备全面能力的实用模型，唯一的路径是与多产品共同设计（co-design），同时稳健地扩规模。他说：“腾讯拥有最好的产品生态和扎实、不张扬（low-ego）的团队文化，我们才刚刚起步。”

　　此前腾讯重金将姚顺雨从OpenAI挖过来，让他以腾讯“CEO/总裁办公室”首席AI科学家的身份，接管腾讯的大语言模型研发，试图打赢科技巨头之间的激烈AI竞赛。

　　姚顺雨到岗后，一直致力于改革公司的AI发展战略，包括打破内部壁垒、精简领导层以及整合模型方面的工作，并于1月底启动了Hy3模型的训练工作。

　　其间，腾讯新成立了AI Infra部、AI Data部、数据计算平台部，强化大模型的研发体系与核心能力。其中，AI基础设施（Infra）涵盖训练算力集群、分布式训练框架、推理优化系统等大模型研发的底层支撑，其稳定性与效率直接决定了模型迭代速度，此前腾讯对算力投入相对保守，资源受限，姚顺雨重构了AI Infra团队，搭建预训练、模型精调、后训练、推理等团队，确定了资源优先级。随后，腾讯又撤销了AI实验室AI Lab，部分人员调整至混元团队，向姚顺雨汇报。

　　混元团队也确立了模型追求实用性的原则，即模型能力要体系化，并不再执着于“刷榜”，模型评价也转向对复杂商业场景的适配度与真实落地效能。这一战略转向体现在两个维度：在评估（Eval）体系上，研发团队内部搭建了超过50个定制化测试基准（Benchmarks），评估模型在工业级场景下的实际可用性，而非追求公开榜单成绩；在迭代路径上，混元贴合腾讯庞大的内部业务，让模型在实际应用中学习进化，即co-design。

　　Co-design的核心要义并非新建模型再寻找产品适配场景，而是模型与产品从设计阶段同步推进，由产品端的真实使用数据反向驱动模型迭代。这套方法论的成立前提，是腾讯长期积累的分发入口资产。

　　腾讯首席战略官詹姆斯·米歇尔曾在3月18日的全年财报电话会上称，腾讯搭建AI团队不只靠薪酬激励，还在于合理规划了内部职责分工以及与腾讯其他业务板块的协作：“我们为团队提供充足算力，以及腾讯独有的、差异化的AI产品应用场景。”

　　据腾讯披露，Hy3 preview在研发阶段与元宝产品团队建立了co-design协作机制。模型团队基于元宝既有的评测体系，针对意图理解、文本创作、深度搜索等指标做了定向训练；同时，元宝积累的用户反馈数据被用于训练数据的优化，调优方向集中在文风、内容组织与专业度等维度。腾讯方面表示，这一机制提升了模型响应在自然度上的表现。

　　随后在Hy3 preview上线后的产品布局中，腾讯混元已嵌入微信的消息总结功能、元宝的问答交互、智能体应用WorkBuddy和Qclaw，构成覆盖消费者与企业的高频使用场景。此外，腾讯旗下还有浏览器、输入法、搜索引擎、游戏、广告等服务和应用，底层有云、算力等基础设施服务。

　　值得注意的是，Hy3 preview的发布节奏，也反映出混元团队在重整后加快了模型迭代。按业界惯例，一个完整大模型版本的上线，涵盖架构探索、高质量数据准备、预训练、后训练、强化学习与精调、评测优化等环节，通常需要6至12个月。Hy3 preview从混元研发架构升级、AI基础设施重建到正式发布，前后不到三个月。这一速度在国内头部大模型厂商中属于罕见。

　　下半场后发制人

　　实际上，Hy3 preview的技术方向选择，酝酿已久。

　　姚顺雨在加入腾讯前一年发表的博客文章《The Second Half》（下半场）中，已经系统地表达了这套思路。他在博客中指出“强化学习终于实现了泛化”，仅在一年前，如果告诉研究者一个统一的“配方”能同时处理软件工程、IMO（国际数学奥林匹克竞赛）级数学、鼠标键盘操作、长篇问答等一系列截然不同的任务，对方会嘲笑这是幻觉，许多研究者花费整个博士生涯钻研的细分方向，正在被同一套方法批量解决。

　　在姚顺雨的判断中，AI的“配方”已基本成型，即大规模语言预训练、数据与算力的规模化、推理，意味着上半场依赖“开发新方法击败基准测试”的游戏规则正在失效，下半场AI开始转向“重新定义评估基准”和真实世界效用问题。

　　观察2026年初以来，国内外头部大模型厂商在战略方向上出现明显的收敛，从拼基准跑分转向拼真实场景的应用落地。Hy3 preview发布后一天，即与业界翘首以待的DeepSeek V4发布撞上档期，而后者也给出类似方向：支持更复杂的智能体应用落地，进一步打开AI应用规模化的空间。

　　腾讯云与智慧产业事业群CEO汤道生近期就在腾讯云上海城市峰会上表示，AI落地不只是一道算法题，更是一道工程题。他进一步称，随着行业发展，主流大模型的能力差距正在逐步缩小，企业的核心需求已经不再是拥有最好的模型，而是如何通过系统工程把模型的能力最大程度发挥出来。即模型能力会趋同，真正拉开差距的是工程化交付能力。

　　而Hy3 preview总参数295B、激活参数21B。这一规模在头部MoE模型中属中等量级，既高于面向终端、边缘场景部署的70B级别开源模型，又显著低于 DeepSeek V4等千亿激活参数以上的旗舰模型。据记者了解，腾讯方面将其定位为兼顾性能与推理成本的平衡选择。伴随此次在OpenRouter登顶，腾讯方面透露，将延续Hy3 preview在该平台的低价API接入策略，并计划通过Token Plan订阅及模型开源等多元化模式，持续服务全球开发者生态。

　　考虑到295B参数规模的Hy3 preview仍属预览版本，混元团队的方法论需在更大参数规模的Hy3正式版上接受验证，并与其他顶尖大模型正面较量。高盛发表研报称，Hy3 preview发布是混元团队全面重组后的关键进展，其维持对腾讯买入评级，目标价700港元。

　　虽然在新一轮人工智能浪潮中被视为“后来者”，意识到智能体时代机不可失的腾讯，正持续积极布局。

　　腾讯总裁刘炽平曾在前述业绩说明会上表示，去年腾讯在AI新产品上投入了180亿元，今年至少翻倍。他认为，AI的应用形态已经从聊天机器人、编码、多模态依次演进，智能体突然出现，进一步将整个AI生态推向去中心化，“如果只参与一场竞赛，后来者确实很难追赶，但如果将AI视为多场并行的竞赛，那么行业里就总会不断出现新的机会和新前沿。”

　　刘炽平还介绍，多模态方面，腾讯的优势是庞大的自研数据和丰富的业务场景，在3D模型和文生图模型方面比较领先，也会继续研发视频和世界模型。

　　“我更担心的是如果我们不够创新，不够快速该怎么办。”刘炽平说。

（文章来源：21世纪经济报道）

文章来源：21世纪经济报道责任编辑：3

原标题：混元Hy3“杀疯了”，腾讯AI大模型下半场排位赛迎来高光

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈