中金:建议2025年关注国内模型性能优化背景下的应用层投资机遇
2025年02月11日 07:56
来源: 每日经济新闻
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  中金公司研报表示,DeepSeek于2025年1月末全球范围内出圈,APP端DAU达2,215万,在AI产品日活总榜中仅次于ChatGPT,在157个国家地区的苹果应用商店下载量排名第一。我们认为,DeepSeek出圈背后的技术创新、工程能力突出,引领全球技术趋势,其降本成果对于端云应用的铺垫作用具备重要意义,建议2025年关注国内模型性能优化背景下的应用层投资机遇。

  全文如下

  中金 | AI智道:DeepSeek技术破局,成本下探引领应用百花齐放

  中金研究

  DeepSeek于2025年1月末全球范围内出圈,APP端DAU达2,215万,在AI产品日活总榜中仅次于ChatGPT,在157个国家地区的苹果应用商店下载量排名第一。我们认为,DeepSeek出圈背后的技术创新、工程能力突出,引领全球技术趋势,其降本成果对于端云应用的铺垫作用具备重要意义,建议2025年关注国内模型性能优化背景下的应用层投资机遇。

  摘要

  DeepSeek V3通过技术创新与工程优化,实现了领先的性价比。其采用自主研发的MoE架构,总参数量达671B,每个token激活37B参数,多维度对标GPT-4o。技术突破包括稀疏专家模型MoE、多头注意力机制MLA和创新训练目标MTP,显著提升推理效率。此外,FP8混合精度训练策略首次大规模应用,兼顾稳定性和性价比,训练成本仅为557万美元,耗时不到两个月。V3的API定价低至百万输入tokens 0.5元,大幅降低使用成本,我们认为有望推动大模型应用端广泛普及。

  DeepSeek R1系列通过强化学习(RL)实现了推理能力边际突破。R1 Zero跳过了传统的大规模监督微调(SFT)环节,直接通过强化学习训练基础模型,达到比肩OpenAI o1的能力,验证了RL在大语言模型中的应用潜力。R1在R1 zero的基础上进一步优化算法,解决了语言一致性等问题。通过底层优化了Nvidia的PTX指令集,R1系列提高了跨平台兼容性,并为国产芯片适配提供了可能。R1的高效推理和低成本使其在产业应用中潜力释放,我们认为有望进一步推动AI应用的普及与规模化。

  DeepSeek Janus-Pro模型在图像理解和生成方面表现出色,实现架构统一。Janus-Pro通过两个编码器分别负责图像理解和生成,共享一个Transformer网络,并采用了三阶段训练优化以提高模型对真实场景的适应能力,模型效果优于Dalle 3等海外成果。

  我们认为Deepseek将带来三方面产业影响。1)数据从“规模驱动”向“质量优先”转变;2)蒸馏技术带动轻量化模型满足高性能、高效率,使大规模端侧部署更进一步;3)国内外大厂追随,有望迎来技术平权,工程化能力和生态系统建设仍是企业构建竞争壁垒的关键要素。

  风险

  技术迭代不及预期,下游商业化不及预期。

(文章来源:每日经济新闻)

文章来源:每日经济新闻 责任编辑:65
原标题:中金:建议2025年关注国内模型性能优化背景下的应用层投资机遇
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500