银河证券研报认为,当前算力板块在推理应用的不断发展中并非呈现出算力需求下降的态势,而是算力需求得到进一步的刺激。当前市场普遍认为推理应用的不断增长将挤压2026年甚至更长时间段内算力板块的成长空间,该种判断可能同算力行业的实际情况有所偏离。在算力需求总体增长的情况下,当前算力相关板块仍然具备较大投资价值,建议优选空间较大且动能充足的细分子板块。
全文如下
【银河通信赵良毕】行业点评丨推理算力重要性提升,光模块发展再加速
核心观点
事件:近日英伟达GPU技术大会2025(GTC 2025)结束。
推理算力预计将持续增长,Scaling Law仍将持续:会上,英伟达CEO表示,通往AGI以及具身智能机器人均需要算力,构建Omniverse与世界模型更需要源源不断的算力,至于最终人类构建一个虚拟的“平行宇宙”,英伟达认为算力需求将是过去的100倍。为了支撑该观点,黄仁勋列出云厂商采购数据,即2024年美国前四云厂总计采购130万颗Hopper架构芯片,到了2025年,这一数据增至360万颗Blackwell GPU,成倍数增长。根据Semianalysis数据,如今模型需要处理超过100万亿个token,推理模型的token数量是之前的20倍,计算量是之前的150倍。同时,英伟达CEO黄仁勋进一步指出,Blackwell的性能比Hopper提高了68倍,导致成本下降了87%。Rubin计划推动更多的性能提升——是Hopper的900倍,成本降低99.97%,算法带来的效率提升与硬件迭代带来的性能提升共振。
硬件端对推理算力的侧重程度更强,软件端发布Dynamo及Llama Nemotron,英伟达AI Agent发展动能充分:我们认为此次GTC 2025,相较于此前GTC大会,硬件性能提升符合预期,英伟达对软件的布局、推理算力以及Agent的愿景更强,硬件发展带动软件及大模型持续高景气。
硬件方面:英伟达发布基于Blackwell架构的升级版Blackwell Ultra,并着重强调了其在推理端的重大进展,可以为数据中心提供50倍增收的机会;英伟达也明确了26-27年乃至更远期的发展规划,硬件性能进一步加速已成定局;CPO交换机方面,英伟达展示了基于1.6T硅光引擎的CPO(共封装光学)交换机系列,硬件端性能未来仍将持续高质量全方位提升。
软件方面:英伟达发布了专注于简化推理部署和扩展的开放AI引擎栈Nvidia Dynamo,可能成功开创推理软硬件效率的新范式;同时发布Nvidia Llama Nemotron,望以Llama Nemotron推理模型作为基础,通过NVIDIA AIQ架构作为Agent模板进行相关方向探索,形成生态闭环。
投资建议
当前算力板块在推理应用的不断发展中并非呈现出算力需求下降的态势,而是算力需求得到进一步的刺激。当前市场普遍认为推理应用的不断增长将挤压2026年甚至更长时间段内算力板块的成长空间,我们认为该种判断可能同算力行业的实际情况有所偏离。在算力需求总体增长的情况下,我们认为当前算力相关板块仍然具备较大投资价值,建议优选空间较大且动能充足的细分子板块
风险提示
AI发展不及预期的风险,全球地缘政治不确定性的风险,算力发展不及预期的风险等。
(文章来源:人民财讯)