上市半月后，摩尔线程技术路线图全面曝光！冲击十万卡集群

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

上市半月后，摩尔线程技术路线图全面曝光！冲击十万卡集群

2025年12月21日 11:42

来源：时代财经

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　上市15天后，摩尔线程（摩尔线程-U,688795.SH）向外界秀出了自己的“肌肉”。

　　12月20日-21日，摩尔线程首届MUSA开发者大会（MDC 2025）举办，摩尔线程创始人、董事长兼CEO张建中一连公布了一系列技术与产品进展，其中包括全新架构“花港”，基于该架构的“华山”、“庐山”芯片，智能SoC芯片“长江”，以及夸娥万卡智算集群和AI算力本MTT AIBOOK等。

　　图源：截图自摩尔线程直播

　　业界惯将摩尔线程比作“中国的英伟达”，在发布会上，张建中也未避讳提到与英伟达的对比。以最新发布的“华山”芯片为例，张建中表示，“华山”的访存带宽、浮点算力和高速互联带宽三个指标能力介于英伟达的最新架构Blackwell和上一代架构Hopper之间，而访存容量则高于二者。

　　图源：截图自摩尔线程直播

　　“过去，大部分大模型开发者不敢用国内的卡训练，怕训练的结果不好。”张建中说，“我们可以有信心地跟大家讲，如果你以前是在Hopper上做训练，你今天用我们的S5000去训练你的大语言模型，效果只会比它好，不会比它差。”

　　在现场，多位摩尔线程的合作企业和开发者告诉时代财经，得益于MUSA框架对CUDA的兼容性，迁移至MUSA生态的难度相较于其他国产芯片更低，但迁移后仍会存在接口适配、功能适应等问题，“（生态）还处于爬坡阶段。”一位企业开发者提到。不过，未来随着厂商积极推进适配优化以及生态内的联动加强，生态成熟度也将持续提升。

　　新架构和新芯片

　　从发布节奏来看，摩尔线程基本保持一年一迭代的节奏。从2022年的苏堤开始，到春晓、曲院、平湖，此次发布会上，摩尔线程发布了新一代全功能GPU架构“花港”。

　　据了解，“花港”基于新一代指令集，支持FP4到FP64的全精度计算，算力密度相比上一代提升50%，效能提升10倍，支持十万卡以上规模智算集群。

　　图源：截图自摩尔线程直播

　　张建中透露，基于该架构，摩尔线程公布两款芯片技术路线。一款是“华山”，专注AI训推一体与超大规模智能计算，集成新一代异步编程与全精度张量计算单元，支持从FP4至FP64的全精度计算；另一款是“庐山”，专攻高性能图形渲染，AI计算性能提升64倍，几何处理性能提升16倍，光线追踪性能提升50倍，并在纹理填充、原子访存能力及显存容量方面有所增强。

　　此外，大会发布了夸娥万卡智算集群，浮点运算能力达到10Exa-Flops，训练算力利用率（MFU）在Dense大模型上达60%，MOE大模型上达40%，有效训练时间占比超过90%，训练线性扩展效率达95%，与国际主流生态兼容。张建中表示，2024年摩尔线程推出第一代千卡集群，今年达到1万卡，接下来还要做10万卡、50万卡、100万卡。

　　摩尔线程针对大模型训练的挑战，打造出的夸娥万卡智算集群及其配套技术方案，可以通过软硬件协同优化保障训练稳定性与精度。张建中表示，摩尔线程选取 DeepSeek V3、DeepSeek R1等主流模型，采用FP8精度进行训练复现。结果显示，其训练loss曲线与Hopper系列显卡基本上一致，而从实际测评结果来看，相同数据量、相同模型的情况下，摩尔线程的训练效果更优于国际主流显卡。

　　除了芯片和智算产品外，摩尔线程还发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK，提供了50TOPS的端侧AI算力，支持包括MT AIOS（Linux）、Windows虚拟机、Android 容器和国产操作系统等多系统切换，支持开发者在不同环境下开发各种国产应用场景。“我们把AI原生的应用场景都内置在这一台AIBOOK中，它是一台多系统随意切换的，结合开发、娱乐、办公于一体的（算力本）。”张建中表示。

　　生态是关键

　　“开发者是生态建设的关键，国产芯片平台必须构建起友好、易用的开发环境，以有效服务开发者社群。”中国工程院院士、清华大学计算机系教授郑纬民在此次大会上表示。

　　“生态体系是GPU行业的核心护城河与价值所在。”张建中也坦言。

　　针对生态，摩尔线程在大会上透露，其搭建的摩尔学院有近20万名开发者与学习者，同时宣布建设MUSA生态中心，发布MUSA开发者计划。

　　事实上，此次发布的MTT AIBOOK本身就是一个连接开发者与MUSA生态的入口。据摩尔线程现场介绍，客户合作初期需要平台验证芯片的适配度，为此他们需要借助专用设备部署算法、开发待推理的模型，而MTT AIBOOK恰好满足了这一需求场景。

　　图源：时代财经摄

　　另外，张建中表示，摩尔线程准备做MUSACode代码生成大模型，MUSACode可以做到自动化的从CUDA转到MUSA，目前已经做到可编译率93%，准确率90%以上。

　　在MUSA生态加速建设的过程中，大量基于传统芯片架构的开发者与企业，正面临不少要从原来的生态，迁移到MUSA生态的情况。

　　摩尔线程展区现场工作人员介绍，在传统迁移场景下，开发者面临的最大成本是代码迁移成本。由于不同硬件体系、架构体系对应的编程语法结构与算子库调用方式存在差异，迁移过程中需适配新的开发规范。为此，摩尔线程推出了相应的配套工具，可实现代码的自动化迁移，无需开发者人工重写代码，仅需进行简单的文本调整，即可实现近乎零成本的迁移。

　　第二类成本则是调试（debug）成本。目前，摩尔线程正逐步实现算子的百分之百替代适配。当开发者原项目中调用的各类算子，均能无缝适配MUSA生态对应的算子，且无运行报错时，调试工作即可完成。总体而言，开发者迁移过程中的最大成本实则为时间成本。

　　时代财经在展区内了解到，近年来，全链国产化愈发成为众多企业的发展趋势。

　　一家初创企业表示，选择摩尔线程的原因之一，是看中其全功能GPU定位，因为这意味着其搭建的生态能够吸引的合作伙伴可能覆盖各行各业。“它目前比英伟达是有性价比的。”该初创企业相关负责人表示，对于开发者而言，选择契合自身现阶段需求的产品即可满足使用要求，价格性价比也更高。

　　另一家工业机器人企业研发人员称，初期与摩尔线程适配时，也存在生态差别、接口不一等不适应的情况，不过经由两边的讨论协商，这些难点都得到了一一解决。“硬件支持上一定是快速做到，只有接口适配，才能在后续进行其他功能的开发。”

　　尚阳科技在两年前开始适配摩尔线程的MUSA生态，通过摩尔线程全功能GPU，其打造了企业级智能体引擎Useek曜芯智问。尚阳科技董事长李向阳向时代财经提到了摩尔线程的GPU全功能的定位，其能够实现了图形处理与计算功能等的一体化集成，部分性能对标英伟达产品。同时，此前多数开发者使用英伟达芯片，其调用算力所依赖的框架为CUDA，而MUSA框架在对CUDA的兼容性上表现优异，这一点与其他平台存在显著差异，也是其核心优势所在。得益于MUSA框架具备深度兼容特性，开发者向该平台迁移项目时，操作流程将更为简便。李向阳称，目前他最关注的是MUSA生态未来在细节功能的适配上的进展。

（文章来源：时代财经）

文章来源：时代财经责任编辑：6

原标题：上市半月后，摩尔线程技术路线图全面曝光！冲击十万卡集群

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈