12月20日,摩尔线程首届MUSA开发者大会(MDC 2025)在北京中关村国际创新中心举行。摩尔线程董事长兼CEO张建中在大会上发布了包括新一代GPU架构“花港”、夸娥万卡智算集群、AI算力本MTT AIBOOK等一系列技术与产品进展。
据悉,这是摩尔线程首次公开全功能GPU技术路线图。摩尔线程表示,公司目前已成功构建起一套以自主统一架构为根基、贯穿“芯-边-端-云”的完整技术栈,实现了从底层硬件到上层应用的系统化闭环,下一步将持续加大研发投入。
“新一代架构及芯片路线图”亮相
MUSA(Meta-computing Unified System Architecture)是摩尔线程自主研发的元计算统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。大会现场,摩尔线程董事长兼CEO张建中宣布,MUSA全新升级至5.0版本,架构步入成熟新阶段,在全栈统一性、极致效能与生态开放性上取得关键突破。
基于MUSA统一体系,摩尔线程发布了新一代GPU架构——“花港”。据介绍,“花港”基于新一代指令集,支持FP4到FP64的全精度计算,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群。
基于“花港”架构,摩尔线程公布了未来将发布的两款芯片技术路线——“华山”和“庐山”:
“华山”专注AI训推一体与超大规模智能计算。集成新一代异步编程与全精度张量计算单元,支持从FP4至FP64的全精度计算,为万卡级智算集群提供稳定高效的算力支撑。

“庐山”芯片技术路线介绍上证报记者窦世平摄
“庐山”专攻高性能图形渲染。其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量。集成AI生成式渲染、UniTE统一渲染架构及全新硬件光追引擎,为3A游戏、高端图形创作提供强大算力支持。
万卡规模下实现AI训练高效稳定
“国产计算显卡与国外主流产品的性能差距正在持续缩小,虽然构建国产万卡乃至十万卡级别的超大规模智算系统存在难度,但这是必须完成的产业基础设施任务。”中国工程院院士、清华大学计算机系教授郑纬民在主题演讲中表示。
此次大会上,摩尔线程发布了夸娥万卡智算集群。据介绍,该集群具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理。核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%,与国际主流生态高度兼容。
推理侧,摩尔线程联合硅基流动,在DeepSeek-R1 671B全量模型上实现单卡推理的性能突破,MTT S5000单卡Prefill吞吐突破4000tokens/s、Decode吞吐突破1000tokens/s;训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,技术层面实现关键优化,Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈。
面向未来,摩尔线程发布了MTT C256超节点的架构规划。该产品采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力,为下一代超大规模智算中心构建兼具超高密度与极致能效的硬件基石。
布局具身智能等未来计算领域
在图形计算领域,摩尔线程的产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流图形与计算API,并与国产主流CPU及操作系统完成了全栈适配,持续扩展游戏及专业应用的兼容覆盖。此外,公司还将完整支持DirectX 12 Ultimate,进一步接轨行业顶级图形标准。
核心渲染技术方面,摩尔线程宣布了两项关键突破——“硬件级光线追踪加速”与“自研AI生成式渲染技术”:基于“花港”架构的硬件光线追踪加速引擎,可实现对DirectX Raytracing(DXR)的支持,使实时、逼真的光影效果在国产GPU上成为可能;定义AI生成式渲染(AGR):推出全自研MTAGR 1.0技术,推动渲染技术范式从“计算”走向“生成”,为下一代数字内容创作及数字孪生等场景构建国产技术基座。
具身智能方面,摩尔线程发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建了开发、仿真、训练的高效统一环境。推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群“端云结合”的MT Robot具身智能解决方案。
“公司将于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA,以开放协作助力机器人产业研发效率提升。”张建中表示。
此外,MUSA生态还与合作伙伴在科学智能(AI for Science)、量子科技、AI for 6G等其他前沿交叉领域展开探索工作。
加速构建国产计算产业生态
“生态”是此次MUSA大会被频频提及的关键词。张建中表示,生态体系是GPU行业的核心护城河与价值所在,依托MUSA架构的优势,公司持续加大研发投入,致力于攻克从硬件到软件的核心技术挑战,以开放创新不断深化与生态伙伴的协同,共同构建自立自强的国产计算产业生态。
“发展‘主权AI’是提升未来国家竞争力的关键,其核心在于实现‘算力自主、算法自强、生态自立’的完整体系。”郑纬民在主题演讲中表示,开发者是生态建设的关键,国产芯片平台必须构建起友好、易用的开发环境,以有效服务开发者社群。
据介绍,以摩尔学院为平台,摩尔线程已构建起产教融合的开发者成长体系,目前汇聚近20万名开发者与学习者,并通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国200多所高校,吸引超10万名学子参与。
大会还发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK。算力本提供50TOPS的端侧AI算力,不仅实现了专业AI开发的“开箱即用”,同时打破了Linux开发、Windows办公与Android应用之间场景壁垒。此外,大会同时预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态。
(文章来源:上海证券报)