中信建投:海外AI行业核心投资逻辑呈现两条主线
2026年05月26日 08:06
来源: 第一财经
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  中信建投证券研报称,海外AI行业核心投资逻辑呈现两条主线:在硬件与基础设施端,大模型推理的“两相结构”与Agent编排工作流导致通用GPU的边际收益下降,算力军备竞赛正向能源与电网要素的竞争演变,并驱动服务器架构向高数据复用率的ASIC(如谷歌TPU)、高性能指挥层CPU(CPU:GPU配比迈向1:1)以及因扩容刚需价格暴涨的DDR5 DRAM发生结构性倾斜;在模型与云生态端,随着OpenAI GPT-5.5的发布,其Codex生态的下载安装量正缩小与Anthropic Claude Code的差距,鉴于模型技术领先到市场份额变化存在3—6个月的滞后效应 ,Microsoft、Oracle及CoreWeave等OpenAI阵营的算力与云合作方正迎来确定性的叙事修正与战略性份额扩张的投资机会。

  全文如下

  中信建投 | 有效算力框架下复盘AI演进:硬件结构性倾斜,云端生态格局重塑

  海外AI行业核心投资逻辑呈现两条主线:在硬件与基础设施端,大模型推理的“两相结构”与Agent编排工作流导致通用GPU的边际收益下降,算力军备竞赛正向能源与电网要素的竞争演变,并驱动服务器架构向高数据复用率的ASIC(如谷歌TPU)、高性能指挥层CPU(CPU:GPU配比迈向1:1)以及因扩容刚需价格暴涨的DDR5 DRAM发生结构性倾斜;在模型与云生态端,随着OpenAI GPT-5.5的发布,其Codex生态的下载安装量正缩小与Anthropic Claude Code的差距 ,鉴于模型技术领先到市场份额变化存在3-6个月的滞后效应 ,Microsoft、Oracle及CoreWeave等OpenAI阵营的算力与云合作方正迎来确定性的叙事修正与战略性份额扩张的投资机会。

图片

  有效算力预测模型预示AI模型性能提升的瓶颈来自物理算力、算法、范式,底层提升瓶颈主要是能源。Leopold Aschenbrenner在2024年6月发布的《Situational Awareness》报告引入了前沿的能力预测假说,即模型能力与由“物理算力×算法效率×Unhobbling杠杆”共同构成的“有效算力”呈现单调线性特征。历史数据显示,前沿AI训练算力在过去10—15年间以年均0.5至0.7个数量级(OOM)的速度扩张。报告推演,2023至2027年间全球AI总有效算力将再次实现约5个OOM的跃升,推动AI跨越AGI初级门槛(对标PhD级专家/自动化AI研究员)。但物理制约正在迫近,预计到2028年,单个前沿集群投资将突破千亿美元级别,峰值电力需求达10GW,AI算力的军备竞赛本质上正演变为能源供应与电网要素的竞争。

  系统级工程优化与ASIC崛起。随着算力规模扩展,大模型竞争焦点已从“大参数+大训练FLOPs”的单一叙事转移到系统级硬件协同。在推理端,大模型工作负载呈现明显的“两相结构”:Prefill阶段偏向算力受限,而Decode阶段更偏向内存带宽受限,HBM的访存带宽成为主要瓶颈。这一特征推动ASIC的机会窗口,如谷歌TPUv6e通过脉动阵列设计实现中间计算的“零访存”,大幅降低了对昂贵HBM带宽的依赖,在Token成本与功耗上建立起对通用GPU的非对称优势,Anthropic已承诺自2026年起部署超100万片新型TPU芯片。此外,算法与底层的打通(如DeepSeek的多Token预测MTP架构及定制显存内核融合)正成为新的工程技术壁垒。

  Agent工程化落地与算力重心向CPU转移。行业评价标准正在从“模型谁最聪明”演变为“Agent系统在崩溃前能自主工作多久”,核心范式转向“Agent=Model+Harness(工具调度、安全护栏等运行环境的基础设施)”。在Agent带来的“长会话+多轮工具回填”工作负载下,系统瓶颈正发生结构性转移:①CPU角色剧变:CPU在编排工作流和工具处理中从配角变为指挥层,相关处理在个别工作负载下可占总延迟的90.6%。②配比靠拢:算力基础设施的CPU:GPU比例正明确从传统的1:8向1:1(Parity)演进,并导致服务器DDR5DRAM因扩容刚需而出现价格暴涨。③范式革新:“VibeCoding”带来的启发式学习(HL)大幅降低了代码规则修改与维护成本,在小样本场景下的效率和最终性能已可比肩甚至超越昂贵的传统深度强化学习(PPO),成为低成本、高可控的Agent迭代新策略。

  当前市场对于①HBM高景气度已经取得较高共识且反映到业绩层面,SK hynix 2026Q1营业利润率 72%(超过Nvidia的65%及台积电的58%),其中DRAM平均售价(ASP)环比上涨mid-60%,NAND ASP上涨mid-70%,受强劲定价支撑。SK Group会长崔泰源在2026年3月表示,全球芯片晶圆短缺可能持续到2030年,因为HBM需求持续超过供应并导致制造产能紧张。他补充说,扩大晶圆产能可能需要至少四到五年时间,预计缺口超过20%。 ②CPU也正处于快速定价阶段,Intel/AMD个股年内涨幅超过100%+,且管理层明确提出CPU长期受益于AI带动TAM大幅提升,Intel 电话会给出 CPU:GPU 从 1:8→1:4→向 parity 的明确口径(agentic orchestration 驱动)。③可能尚未充分发掘的方向: NVMe/eSSD、DPU、CXL/分层内存软件栈。在KV分层/多agent并发下,会变成不可或缺的系统部件(Samsung offload、SNIA distributed KV 都在给它补叙事)。

  前沿模型商业化路径的结构性分化。在全球模型竞争与份额变迁上,存在三个关键动态:①国内外性能错位:国产模型虽然在公开基准测试上直追海外,但在引入防泄露的半私有/私有加权测试后,真实场景表现实际落后美国顶尖模型约8个月,目前的竞争优势仍主要维系在开源和极高性价比上。②前沿模型差异化:在前沿Agent领域,GPT-5.5在终端优先Agent(Shell执行与DevOps自动化)中具备明显的Token节省(少用72%输出Token)与速度优势;而ClaudeOpus4.7则在代码库优先Agent(PR审查、多语言重构)和工具编排协议(MCP)上保持领先。③云厂商投资启示:随着GPT-5.5的发布,OpenAI旗下的Codex在下载及VSCode插件安装量上正快速反超或缩小与ClaudeCode的差距。由于模型领先转化为市场份额存在3—6个月的滞后效应,这预示着Microsoft、Oracle、CoreWeave等OpenAI阵营的算力与云合作伙伴正迎来叙事修正与份额变化的投资机会。

(文章来源:第一财经)

文章来源:第一财经 责任编辑:70
原标题:中信建投:海外AI行业核心投资逻辑呈现两条主线
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500