华泰证券：DeepSeek有望加速模型训练与CUDA解耦

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

华泰证券：DeepSeek有望加速模型训练与CUDA解耦

2025年02月21日 08:00

来源：证券时报网

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　证券时报网讯，华泰证券研究认为，DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法，PTX是CUDA编译的中间代码，在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码，Triton的底层可调用CUDA，也可调用其他GPU语言，包括AMD的rocm以及国产算力芯片语言，如寒武纪的思元590芯片和海光信息的深算一号（DCU）内置的HYGON ISA指令集。LLM的训练短期内虽未完全脱离CUDA 生态，但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势，并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已经很好的适配了DeepSeek-R1 等国产模型，并取得了高效推理的效果，华泰证券认为，伴随海外算力的受限，针对国产算力的优化或将有持续进展，值得重视。

（文章来源：证券时报网）

文章来源：证券时报网责任编辑：13

原标题：华泰证券：DeepSeek有望加速模型训练与CUDA解耦

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈