DeepSeek首次披露:理论成本利润率545%
2025年03月01日 22:02
作者: 张露
来源: 广州日报
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  3月1日,DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更首次披露了成本利润率等关键财务数据,引发业内强烈关注。最值得注意的是,DeepSeek表示,如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为 $562,027,成本利润率 545%。

  根据DeepSeek官方披露,DeepSeek V3 和 R1 的所有服务均使用 H800 GPU,使用和训练一致的精度,最大程度保证了服务效果。同时,通过动态调整节点资源实现效率最大化。

  在最近的24小时里(北京时间 2025/02/27 12:00 至 2025/02/28 12:00),DeepSeek V3 和 R1 推理服务占用节点总和,峰值占用为 278 个节点,平均占用 226.75个节点(每个节点为8个 H800 GPU)。假定 GPU 租赁成本为2美金/小时,总成本为 $87,072/天。

  DeepSeek透露,如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为 $562,027,成本利润率 545%。据悉,DeepSeek R1 的定价:$0.14 / 百万输入 tokens (缓存命中),$0.55 / 百万输入 tokens (缓存未命中),$2.19 / 百万输出 tokens。

  不过,DeepSeek表示,实际上没有这么多收入,因为 V3 的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

  此外,DeepSeek还公布了DeepSeek-V3/R1推理系统概述。为实现更大的推理吞吐量与更低的延迟,DeepSeek的方案是使用大规模跨节点专家并行(Expert Parallelism / EP)。首先 EP 使得 batch size 大大增加,从而提高 GPU 矩阵乘法的效率,提高吞吐。其次 EP 使得专家分散在不同的 GPU 上,每个 GPU 只需要计算很少的专家(因此更少的访存需求),从而降低延迟。通过EP增大batch size、将通信延迟隐藏在计算之后,并执行负载均衡,以此应对EP带来的系统复杂性挑战。

(文章来源:广州日报)

文章来源:广州日报 责任编辑:137
原标题:DeepSeek首次披露:理论成本利润率545%
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500