混元Hy3“杀疯了”,腾讯AI大模型下半场排位赛迎来高光
2026年05月07日 21:04
来源: 21世纪经济报道
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈


K图 00700_0

  5月7日,在全球最大的API聚合平台OpenRouter公布的周榜上,腾讯最新语言模型混元Hy3 preview的Token(词元)调用量与市场占有率双双登顶。腾讯方面同日披露,上线两周,这款新模型的调用量已超过其上一代Hy2的10倍,在自家CodeBuddy、WorkBuddy等智能体应用中Token调用量高涨16.5倍。两份来之不易的成绩,成为过去一年腾讯AI叙事中少有的高光,同日腾讯股价大涨超3%。

  此前在4月23日,腾讯发布并开源混元Hy3 preview模型,将其称之为“混元重建后训练的第一个模型”,也是混元迄今最智能的模型。Hy3 preview是一个快慢思考融合的MoE(混合专家)架构模型,总参数295B,激活参数21B,最大支持256K上下文长度,提升的方向包括复杂推理、指令遵循、上下文学习、代码、改进工具使用和规划能力等。

  驱动力重构

  Hy3 preview也是姚顺雨上任后混元大模型首次重大更新,模型发布当天,姚顺雨在社交媒体上写道,腾讯的目标是做出超越公开榜单、具备全面能力的实用模型,唯一的路径是与多产品共同设计(co-design),同时稳健地扩规模。他说:“腾讯拥有最好的产品生态和扎实、不张扬(low-ego)的团队文化,我们才刚刚起步。”

  此前腾讯重金将姚顺雨从OpenAI挖过来,让他以腾讯“CEO/总裁办公室”首席AI科学家的身份,接管腾讯的大语言模型研发,试图打赢科技巨头之间的激烈AI竞赛。

  姚顺雨到岗后,一直致力于改革公司的AI发展战略,包括打破内部壁垒、精简领导层以及整合模型方面的工作,并于1月底启动了Hy3模型的训练工作。

  其间,腾讯新成立了AI Infra部、AI Data部、数据计算平台部,强化大模型的研发体系与核心能力。其中,AI基础设施(Infra)涵盖训练算力集群、分布式训练框架、推理优化系统等大模型研发的底层支撑,其稳定性与效率直接决定了模型迭代速度,此前腾讯对算力投入相对保守,资源受限,姚顺雨重构了AI Infra团队,搭建预训练、模型精调、后训练、推理等团队,确定了资源优先级。随后,腾讯又撤销了AI实验室AI Lab,部分人员调整至混元团队,向姚顺雨汇报。

  混元团队也确立了模型追求实用性的原则,即模型能力要体系化,并不再执着于“刷榜”,模型评价也转向对复杂商业场景的适配度与真实落地效能。这一战略转向体现在两个维度:在评估(Eval)体系上,研发团队内部搭建了超过50个定制化测试基准(Benchmarks),评估模型在工业级场景下的实际可用性,而非追求公开榜单成绩;在迭代路径上,混元贴合腾讯庞大的内部业务,让模型在实际应用中学习进化,即co-design。

  Co-design的核心要义并非新建模型再寻找产品适配场景,而是模型与产品从设计阶段同步推进,由产品端的真实使用数据反向驱动模型迭代。这套方法论的成立前提,是腾讯长期积累的分发入口资产。

  腾讯首席战略官詹姆斯·米歇尔曾在3月18日的全年财报电话会上称,腾讯搭建AI团队不只靠薪酬激励,还在于合理规划了内部职责分工以及与腾讯其他业务板块的协作:“我们为团队提供充足算力,以及腾讯独有的、差异化的AI产品应用场景。”

  据腾讯披露,Hy3 preview在研发阶段与元宝产品团队建立了co-design协作机制。模型团队基于元宝既有的评测体系,针对意图理解、文本创作、深度搜索等指标做了定向训练;同时,元宝积累的用户反馈数据被用于训练数据的优化,调优方向集中在文风、内容组织与专业度等维度。腾讯方面表示,这一机制提升了模型响应在自然度上的表现。

  随后在Hy3 preview上线后的产品布局中,腾讯混元已嵌入微信的消息总结功能、元宝的问答交互、智能体应用WorkBuddy和Qclaw,构成覆盖消费者与企业的高频使用场景。此外,腾讯旗下还有浏览器、输入法、搜索引擎、游戏、广告等服务和应用,底层有云、算力等基础设施服务。

  值得注意的是,Hy3 preview的发布节奏,也反映出混元团队在重整后加快了模型迭代。按业界惯例,一个完整大模型版本的上线,涵盖架构探索、高质量数据准备、预训练、后训练、强化学习与精调、评测优化等环节,通常需要6至12个月。Hy3 preview从混元研发架构升级、AI基础设施重建到正式发布,前后不到三个月。这一速度在国内头部大模型厂商中属于罕见。

  下半场后发制人

  实际上,Hy3 preview的技术方向选择,酝酿已久。

  姚顺雨在加入腾讯前一年发表的博客文章《The Second Half》(下半场)中,已经系统地表达了这套思路。他在博客中指出“强化学习终于实现了泛化”,仅在一年前,如果告诉研究者一个统一的“配方”能同时处理软件工程、IMO(国际数学奥林匹克竞赛)级数学、鼠标键盘操作、长篇问答等一系列截然不同的任务,对方会嘲笑这是幻觉,许多研究者花费整个博士生涯钻研的细分方向,正在被同一套方法批量解决。

  在姚顺雨的判断中,AI的“配方”已基本成型,即大规模语言预训练、数据与算力的规模化、推理,意味着上半场依赖“开发新方法击败基准测试”的游戏规则正在失效,下半场AI开始转向“重新定义评估基准”和真实世界效用问题。

  观察2026年初以来,国内外头部大模型厂商在战略方向上出现明显的收敛,从拼基准跑分转向拼真实场景的应用落地。Hy3 preview发布后一天,即与业界翘首以待的DeepSeek V4发布撞上档期,而后者也给出类似方向:支持更复杂的智能体应用落地,进一步打开AI应用规模化的空间。

  腾讯云与智慧产业事业群CEO汤道生近期就在腾讯云上海城市峰会上表示,AI落地不只是一道算法题,更是一道工程题。他进一步称,随着行业发展,主流大模型的能力差距正在逐步缩小,企业的核心需求已经不再是拥有最好的模型,而是如何通过系统工程把模型的能力最大程度发挥出来。即模型能力会趋同,真正拉开差距的是工程化交付能力。

  而Hy3 preview总参数295B、激活参数21B。这一规模在头部MoE模型中属中等量级,既高于面向终端、边缘场景部署的70B级别开源模型,又显著低于 DeepSeek V4等千亿激活参数以上的旗舰模型。据记者了解,腾讯方面将其定位为兼顾性能与推理成本的平衡选择。伴随此次在OpenRouter登顶,腾讯方面透露,将延续Hy3 preview在该平台的低价API接入策略,并计划通过Token Plan订阅及模型开源等多元化模式,持续服务全球开发者生态。

  考虑到295B参数规模的Hy3 preview仍属预览版本,混元团队的方法论需在更大参数规模的Hy3正式版上接受验证,并与其他顶尖大模型正面较量。高盛发表研报称,Hy3 preview发布是混元团队全面重组后的关键进展,其维持对腾讯买入评级,目标价700港元。

  虽然在新一轮人工智能浪潮中被视为“后来者”,意识到智能体时代机不可失的腾讯,正持续积极布局。

  腾讯总裁刘炽平曾在前述业绩说明会上表示,去年腾讯在AI新产品上投入了180亿元,今年至少翻倍。他认为,AI的应用形态已经从聊天机器人、编码、多模态依次演进,智能体突然出现,进一步将整个AI生态推向去中心化,“如果只参与一场竞赛,后来者确实很难追赶,但如果将AI视为多场并行的竞赛,那么行业里就总会不断出现新的机会和新前沿。”

  刘炽平还介绍,多模态方面,腾讯的优势是庞大的自研数据和丰富的业务场景,在3D模型和文生图模型方面比较领先,也会继续研发视频和世界模型。

  “我更担心的是如果我们不够创新,不够快速该怎么办。”刘炽平说。

(文章来源:21世纪经济报道)

文章来源:21世纪经济报道 责任编辑:3
原标题:混元Hy3“杀疯了”,腾讯AI大模型下半场排位赛迎来高光
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500