智源研究院院长王仲远:世界模型是下一代人工智能的基座模型
2026年06月13日 07:04
作者: ● 本报记者 杨洁
来源: 中国证券报
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  在2026北京智源大会召开之际,智源研究院院长王仲远接受了中国证券报记者采访,详解智源从“悟道”到“悟界”的技术演进逻辑,并阐释下一代人工智能的核心发展路径。

  王仲远表示,世界模型是下一代人工智能的基座模型,当前的瓶颈主要体现在真实物理数据匮乏、技术路线尚未收敛、评测体系不完善等。对于世界模型的未来演进发展,王仲远持谨慎乐观态度:“至少未来三到五年,都会是世界模型持续演进迭代的阶段。科研探索这件事说不准,可能卡在一个难点三五年也没突破,但也可能突然迎来技术爆发。”

  此外,王仲远呼吁行业共建评测体系,围绕“预测下一个物理状态”构建统一的评测基准,共同推动世界模型技术的实质性进步。

  “预测下一个物理状态”

  一段时间以来,“世界模型”成为人们谈及人工智能最火热的概念,这背后是人工智能范式的重大变革。王仲远说:“人工智能正加速从数字世界迈向物理世界。早年大语言模型处理的是文字问题,多模态模型开始引入图像、音频、脑信号,接下来要去解决的就是真实物理世界的问题。智源推出的‘悟界’系列大模型核心理念就是解决人工智能从数字世界迈向物理世界的关键能力和关键问题,构建面向物理世界的人工智能基座模型。”

  在王仲远看来,用AI解决真实物理世界的问题,意味着AI在把“预测下一个词元”做到极致之后,向“预测下一个物理状态”的范式跃迁。

  王仲远将当前的主流世界模型技术路径分为四类,第一类是以语言为中心的世界模型,第二类是以像素为中心的世界模型,第三类是以三维结构为中心的世界模型,第四类是以视觉表征为中心的世界模型。但他也坦言,这四类模型距离真正面向物理世界的基座模型都有很大的距离。

  “很多人把视频生成模型等同于世界模型,这是典型的概念误用。”王仲远直言,“视频生成模型可以生成‘猪在天上飞’的画面,因为它采用大量科幻电影训练,它的训练目标从来不是还原真实物理规则,只是通过大量视频学习能够捕捉到一定的世界知识。语言大模型能答对高考物理题,但也不代表它理解真实物理世界的交互逻辑。这四类路线都有各自的技术价值,但距离真正能支撑物理世界交互的基座模型,还有很长的路要走。世界模型现在仍处于早期,需要开展大量的科研探索工作。”

  数据是核心瓶颈之一

  “以具身智能为例,为何现在的机器人不能像人类一样执行各种任务、灵活应对各种场景?核心就是缺乏对世界常识、物理规律的通用理解。机器人可以在操作台上、流水线上很好地完成一些特定的任务,但不具备泛化性和通用性。”王仲远表示,“一个杯子从桌边掉下来会发生什么,人类一眼就能判断,但对现在的AI来说,要完成感知、理解、交互、决策的完整链路,还没法完全做到。”

  在王仲远看来,数据是当前世界模型发展的核心瓶颈之一。真实物理世界的多模态交互数据极度稀缺,不同技术路线对数据的需求也不相同。他判断,未来随着具身硬件的普及,有了“物理世界的互联网”,真实物理世界数据得到大规模积累后,才有可能真正催生出跨时代的世界模型,就像当年数字互联网数据催化了大语言模型的爆发一样。

  与此同时,他也提醒,仿真的数据有用,但仿真也有缺陷。“各种物理仿真工具、游戏引擎都可以对世界进行模拟,但因为人类掌握的真实物理知识、引擎规则和算法还不够完备,仿真始终不能达到真正的100%,都会有各自的遗憾和缺陷。至于遗憾和缺陷的数据占多大比例?我们还在实验。”

  持续迭代深耕

  智源研究院是国内最早布局世界模型研究的科研机构。2025年智源研究院发布的悟界·Emu3.5,内置时空关系、因果逻辑与物理世界演化规律建模能力,攻克了生成内容违背真实世界物理规则的行业痛点,这一原创性成果于2026年1月刊发于《Nature》正刊,创造了国产多模态大模型的众多纪录。

  本届智源大会上,智源研究院发布了全球首个通用世界基座模型悟界·Physis-v0.1,尝试走出第五个世界模型技术路径。据介绍,悟界·Physis-v0.1以物理隐空间表征替代传统像素、帧级预测方案,可实现跨场景通用物理规律强化学习。其搭载专属物理状态编码器,可完成视频、深度RGB、3D点云、力触反馈等全模态信息压缩,统一转化为标准化隐空间物理状态Latent State。模型支持50多个复杂物理场景长程推理,具备物理一致性、动作因果性、长程可推演性、通用泛化性四大核心能力,可广泛应用于严肃工业、具身智能、物理仿真、科学研究等真实物理场景。

  “我们尝试把不同模态的信息都压缩到同一个物理隐空间,再解码成不同的下游输出。”王仲远表示,“目前悟界·Physis-v0.1还只是0.1版本,我们愿意把研发中的思考和进展全部分享出来,希望推动行业扎扎实实把底层问题做透。”

(文章来源:中国证券报)

文章来源:中国证券报 责任编辑:126
原标题:世界模型是下一代人工智能的基座模型
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500