AI竞赛转向推理,英伟达宣布Rubin芯片平台全面投产
2026年01月06日 08:46
来源: 21世纪经济报道
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

K图 NVDA_0

  英伟达2026年的首场重头戏比以往来得更早。

  当地时间1月5日,在美国CES上,黄仁勋出乎意料地提前发布了下一代AI芯片平台“Rubin”,打破了英伟达通常在每年3月GTC大会上集中公布新一代架构的传统。

  AI竞赛进入推理时代,英伟达决定加速出击。

  Rubin并非空降。

  早在2025年3月的GTC大会上,黄仁勋就已预告了代号“Vera Rubin”的超级芯片,并明确其将于2026年量产。

  此次在CES上,黄仁勋对Rubin平台进行了系统性发布,Rubin成为英伟达最新GPU的代号。

  “Rubin的到来正逢其时。无论是训练还是推理,AI对计算的需求都在急剧攀升。”黄仁勋表示,“我们坚持每年推出新一代AI超级计算机,通过六颗全新芯片的极致协同设计,Rubin正在向AI的下一个前沿迈出巨大一步。”

  Rubin平台采用极端协同设计理念,整合了6颗芯片,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换芯片,覆盖了从计算、网络到存储与安全的多个层级。

  相比前代Blackwell架构,Rubin加速器在AI训练性能上提升3.5倍,运行性能提升5倍,并配备拥有88个核心的新款中央处理器(CPU)。

  相比英伟达Blackwell平台,Rubin平台实现推理token成本最高可降低10倍,训练MoE(专家混合)模型所需GPU数量减少4倍。

  同时,Vera Rubin NVL72机柜级系统和平台同步发布,命名上非外界预计的NVL144。对此,英伟达高管在沟通会上向21世纪经济报道等记者指出,NVL72指的是72个GPU封装单元,每个封装内部包含2个Rubin Die,因此系统中实际包含144个Rubin Die,这并不意味着系统规模变化。

  在生态层面,Rubin已获得头部云厂商和模型公司的集中响应。AWS、Microsoft、Google、OpenAI、Anthropic、Meta、xAI、CoreWeave等均被列入首批采用名单。

  Rubin在CES的提前亮相,也引发了外界对英伟达产品发布节奏变化的关注。对此,英伟达高管回应称,目前构成Vera Rubin平台的六颗芯片已经全部到位,相关系统已在运行真实应用负载,并取得了积极结果。

  此次在CES上提前披露Rubin,主要是为了尽早向生态伙伴提供工程样品,方便其为后续部署和规模化应用做准备。英伟达同时强调,Rubin仍将按照既定节奏推进,计划在今年下半年进入量产爬坡阶段,这一时间安排与此前披露的路线图保持一致。

  随着AI进入推理阶段,黄仁勋展示的不只是Rubin平台。

  在CES演讲中,英伟达还发布了一系列AI体系产品,包括开源模型、AI存储、物理AI等。这是英伟达的全栈AI布局,同时也是其在继续释放信号:AI重心继续从“训练规模”转向“推理系统”。

  具体来看,英伟达发布了推理上下文存储平台(Inference Context Memory Storage Platform),这是一个专为推理场景设计的AI原生存储平台。该平台由BlueField-4 DPU与Spectrum-X以太网支撑,在GPU与传统存储之间引入新的存储层,用于高效管理和共享KV Cache,减少重复计算带来的算力浪费。

  同时,黄仁勋特别强调了物理AI。在更长期的布局上,英伟达围绕物理AI推进,发布了一系列开源模型、开发框架和硬件平台,将AI能力从数据中心延伸至机器人、自动驾驶与工业边缘场景。

  黄仁勋表示:“AI已经不再是一次性问答的聊天机器人,而是能够理解物理世界、进行长期推理、使用工具完成真实工作,并同时保有短期和长期记忆的智能协作者。”

  面向机器人领域,英伟达发布了Cosmos与GR00T系列开源模型,用于机器人学习、推理与动作规划。

  其中,Cosmos Reason 2是一款推理型视觉语言模型(VLM),使机器能够“看见、理解并在物理世界中行动”;GR00T N1.6 则是一款面向类人机器人的推理型视觉-语言-动作(VLA)模型,用于解锁全身控制能力。

  “机器人领域的ChatGPT时刻已经到来,”黄仁勋表示,“能够理解现实世界、进行推理并规划行动的物理AI模型,正在解锁全新的应用场景。英伟达覆盖Jetson、CUDA、Omniverse 以及开源物理AI模型的完整技术栈,正在赋能全球合作伙伴,通过AI驱动的机器人重塑各个行业。”

  在自动驾驶领域,英伟达发布了Alpamayo开源模型家族,定位为面向“长尾场景”的推理型自动驾驶基础模型。该体系配套发布了AlpaSim高保真仿真框架以及覆盖1700多小时驾驶数据的开源数据集,用于训练和验证基于推理的自动驾驶系统。黄仁勋表示,英伟达的首款AV车将于第一季度在美国推出,其他地区紧随其后。

  从Rubin平台的提前亮相,到推理存储与物理AI的同步推进,英伟达正在将AI基础设施的竞争推向“系统工程能力”。

  在这一阶段,真正拉开差距的,已不只是芯片算力本身,而是从架构、系统到生态的整体交付。

(文章来源:21世纪经济报道)

文章来源:21世纪经济报道 责任编辑:6
原标题:AI竞赛转向推理,英伟达宣布Rubin芯片平台全面投产
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500