国内首款光互连光交换GPU超节点——光跃LightSphere X发布|聚焦WAIC 2025
2025年07月28日 18:19
作者: 马云飞
来源: 国际金融报
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  万亿参数大模型与多模态训练的崛起,正推动算力集群加速迈入 “万卡协同” 时代。超节点架构通过深度整合GPU资源,在超节点内构建低延迟、高带宽的统一算力实体,已成为支撑这一技术演进的核心技术支柱。

  7月28日,在2025世界人工智能大会(WAIC 2025)“智算云启,共绘生态” 论坛上,上海仪电联合曦智科技、壁仞科技及中兴通讯,正式发布国内首个光互连光交换 GPU 超节点——光跃 LightSphere X。该超节点是基于曦智科技全球首创的分布式光交换技术,集成硅光技术光互连光交换芯片、壁仞科技自主原创架构的大算力通用 GPU 液冷模组与全新载板互连,搭载中兴通讯高性能 AI 国产服务器及仪电智算云平台软件,构建起高带宽、低延迟、灵活可扩展的自主可控智算集群新范式,即将在上海仪电智算中心正式部署。

  据记者了解,当前业界常见方案是通过提升单机柜功耗部署更多 GPU,但受限于数据中心单机柜功耗天花板,单机柜 GPU 密度提升存在明显瓶颈。对此,光跃 LightSphere X 创新性采用光互连技术,通过增加机柜数量构建超节点,突破传统互连方式下超节点的物理边界限制。相比铜缆,光缆的远距离传输优势可实现硬件交付与机柜部署的解耦,其核心价值在于:突破单机柜功耗桎梏,支持万卡级弹性扩展;兼容现有机房设施以降低部署成本;可按算力需求动态调整超节点规模,实现分阶段建设。

  同时,光跃 LightSphere X 全球首创的分布式光交换(dOCS,distributed Optical Circuit Switch)技术,进一步提升了超节点的灵活性与系统可扩展性,显著优化系统性价比。不同于传统集中式交换,该技术通过在每个 GPU 上集成光交换功能,可灵活切换 GPU 间互连拓扑结构 —— 既能在故障场景下实现拓扑实时重构,提升大模型训推性能并降低 GPU 冗余成本;又能按模型算力需求动态调整超节点规模,灵活切换拓扑网络。此外,分布式设计支持 GPU 高带宽通讯域的弹性扩展,光跃 LightSphere X 将实现2千卡规模部署。

马云飞/摄

  据官方介绍,得益于多计算芯粒(Chiplet)与 CoWoS 2.5D 封装协同设计的 GPU 模组,光跃 LightSphere X 具备强大算力。该模组基于自主原创架构的大算力(单卡1P级)通用 GPU 液冷模组,为集群训推性能提供了强劲支撑。通过自主研发的智算云平台软件,可灵活调配超节点网络拓扑,支持密集通信和更大 TP&EP 配置,高效适配各类大模型需求,大幅提升节点可扩展性。其 OCS UBB 采用独创的革新载板设计,结合超低损板材多层架构,实现了丰富灵活的互联拓扑。这一训推一体架构可动态分配计算资源,既能够满足千亿参数大模型训练的高吞吐需求,又能保障推理任务的低时延响应。

  值得一提的是,光跃LightSphere X的上层软件平台同样值得关注。其智算集群统一管理平台通过深度融合调度引擎与训推框架,实现了对超节点全生命周期的智能管控。智算平台能够依据不同模型特征,进行超节点拓扑智能配置,显著提升训练性能;基于全局资源可观测体系,实现故障节点秒级替换与分钟级断点续训,保障模型长稳运行。此外,通过软硬协同的系统级工程优化,进一步释放了超节点在性能和效率等方面的综合潜能。

(文章来源:国际金融报)

文章来源:国际金融报 责任编辑:91
原标题:国内首款光互连光交换GPU超节点——光跃LightSphere X发布|聚焦WAIC 2025
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500