当算力开始按Token计价,这家芯片公司换了一种打法
2026年04月02日 11:20
来源: 时代财经
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈


K图 06082_0

  2026年的算力产业,正在从“比芯片”,走向“比体系”。

  过去很长一段时间里,行业的竞争逻辑高度收敛:谁能做出更先进制程的芯片、谁能在单卡上跑出更高的性能,谁就掌握话语权。但大模型的爆发,正在把这套规则一点点拆解。训练不再是终点,推理成为主战场;算力不再是一次性投入,而是持续消耗的生产资料。

  一个更直观的变化是,算力开始被重新“计量”。随着Token成为AI应用的基本单位,数据中心的角色也在发生转变,它不再只是堆叠服务器的物理空间,而更像一座持续运转的“工厂”,以电力和数据为原料,稳定输出Token。衡量算力能力的标准,也从“峰值性能”,转向“单位成本下的持续产出”。

  在这样的背景下,单芯片性能的重要性被系统效率所稀释。芯片、互联、存储、软件栈以及调度能力,构成一个高度耦合的整体,任何短板都会放大成本、吞噬性能。算力的竞争,开始从“点”的突破,转向“面”的协同。

  也正是在这一轮范式切换中,壁仞科技的路径逐渐清晰起来。

  如果简单将其定义为一家GPU公司,已经很难解释其近几年的动作。从早期聚焦通用GPU芯片落地,到构建面向大模型训练与推理的超节点集群,再到持续补齐软件栈能力,提供软硬件深度协同的整体解决方案,壁仞的重心,正在从“做一颗芯片”,转向“交付一套算力”。

  商业模式正在进化

  在国内GPU公司中,壁仞科技是较早“出圈”的玩家之一。2022年,其首款旗舰芯片BR100发布,以高峰值算力迅速引发市场关注,也被视为国产GPU中少数具备对标国际一线水平潜力的产品。在这一阶段,壁仞的定位仍然清晰,一家以产品力突围的芯片设计公司。

  但随着大模型的爆发,尤其是“OpenClaw”等智能体应用的兴起,模型的运行方式正在发生根本变化。它不再是被动响应一次提问,而是围绕用户目标展开持续行动:调用工具、分解任务、反复推理,在多轮交互中不断修正路径。

  这直接改变了算力的消费逻辑,从“买设备”,转向“买产出”。客户关心的,不再只是单卡性能,而是单位时间内能生成多少Token、单位Token成本是多少,以及系统能否长期稳定运行。

  壁仞科技的转向,正是由此展开。通过“芯片+系统+生态”的整合型商业模式,壁仞科技正在将算力从硬件产品,转变为高效、稳定的系统级能力。

  过去几年,壁仞科技产品形态逐步从单一芯片扩展至覆盖芯片、板卡、服务器及集群的完整体系。在硬件层,持续迭代GPGPU架构与SoC设计,并通过Chiplet技术推动多裸晶封装;在系统层,提供PCIe卡、OAM模块及整机服务器等多形态产品,并支持风冷与液冷方案,以适配数据中心能耗与密度约束。

  从实际落地情况看,这一路径已在部分场景中得到验证。根据灼识咨询的资料,壁仞科技是中国首批在商业化产品中引入PCIe Gen5、CXL、高性能DRAM及双裸晶芯粒设计的GPGPU公司之一,同时也是较早完成高性能OAM及通用底板开发、原型验证并实现量产的厂商之一。

  更关键的变化,发生在软件与集群层。

  围绕自研的BIRENSUPA软件平台,壁仞将各类硬件系统与AI应用场景打通,提供包括程序设计界面、高性能资料库、训练与推理框架以及完整工具链在内的一体化能力,从而显著降低AI开发与部署的复杂度。在此基础上,其进一步强化生态兼容性,即BIRENSUPA与其他第三方GPGPU计算软件平台兼容,大幅降低了GPGPU产品成本。

  顺着这一能力延伸,壁仞将软硬件体系与服务器、存储及网络等基础设施整合,形成面向大规模训练与推理的集群解决方案。换句话说,其试图解决的,已不再只是“芯片能跑多快”,而是“系统能否稳定、高效地运行”。

  灼识咨询资料显示,壁仞是国内最早实现千卡级GPU集群商用的公司之一;在实际运行中,千卡集群可连续稳定运行5天以上无软硬件故障,训练任务持续30余天不中断。

  高速成长的财务印证

  商业模式是否跑通,最终要在财务数据中得到验证。壁仞科技2025年的表现,提供了一组相对清晰的信号。

  2025年,壁仞科技实现收入10.35亿元,同比增长207.2%。这轮高速增长的直接驱动因素,是旗舰通用GPU产品的规模化量产与交付,以及多个千卡级智算集群项目的落地。其中,BR106与BR166系列完成全形态量产,而作为最新旗舰产品的BR166于2025年8月才开始放量,在不到半年的时间里便贡献了可观增量。

  这一表现具有一定指示意义:在放量时间相对有限的情况下仍实现收入跃升,侧面反映出市场对国产高端算力产品的需求正在快速释放,也从侧面验证了壁仞在高性能算力市场中的产品竞争力。

  盈利能力的改善同样值得关注。毛利率达到53.8%,已进入相对健康区间。在通用GPU这类高研发、高门槛行业中,毛利水平往往直接反映产品定价能力与客户接受度。毛利的提升,意味着其不仅“卖得动”,且具备一定议价空间。

  在可持续性层面,客户与订单结构提供了另一重支撑。收入增长并非依赖单一产品或单一客户,而是建立在通用GPU产品与千卡级集群项目的组合交付之上,客户覆盖算力平台、电信运营商及大模型公司等高需求主体。这种多元结构,有助于平滑周期波动,并为后续增长提供延续性。

  资金侧亦较为充裕。截至2025年底,壁仞科技持有现金及金融资产28.96亿元,叠加2026年初IPO募集资金,总体资金规模超过85亿元,为持续研发、产能扩张及项目交付提供支撑。

  事实上,壁仞的商业逻辑,正从单一的技术驱动,过渡到技术与商业化能力同步推进的阶段。收入的快速放量验证了市场接纳度,毛利改善体现产品竞争力,而多元客户与在手项目,则构成其增长延续的基础。

  向上突破:下一代技术与生态

  如果说过去几年,壁仞科技完成的是从“芯片设计公司”向“系统级算力提供者”的转身,那么其后续成长空间,取决于技术演进与生态绑定。

  首先是技术侧的前瞻布局。

  在既有产品体系之外,壁仞已明确推进基于新一代架构的BR20X系列,面向云端训练与推理场景。从技术方向看,这一代产品并非简单性能升级,而是围绕当前大模型计算特征进行针对性优化,包括对FP8、FP4等更广泛数据格式的原生支持,更大更快的内存、更高速的互连带宽及超节点系统设计。本质上,其目标是提升单位算力的有效产出,并压低整体拥有成本,以适应“Token工厂”的算力需求。

  此外,更长周期的产品节奏亦已铺开。面向云端训练与推理的BR30X,以及面向边缘侧的BR31X,预计于2028年前后进入商业化阶段。目前相关产品仍处于可行性分析及早期研发过程中,但其指向较为明确,在算力能力、扩展能力及生态适配性上继续外延,为后续市场竞争预留空间。

  与芯片演进同步推进的,是对超大规模集群的前置投入。

  基于自主原创的Chiplet架构大算力GPU和光互连技术,壁仞正在构建万卡级乃至更大规模的国产GPU集群体系。相较传统缆互连,光互连在带宽、延迟与传输距离方面具有明显优势,被视为支撑超大规模算力集群的关键基础设施。

  在生态层面,壁仞正尝试从“适配模型”转向“参与定义模型”。其与阶跃星辰、上海仪电旗下智算服务共建的人工智能联合实验室,即是这一思路的体现。三方分别在算力、模型与基础设施运营侧形成分工,试图打通从芯片到模型、再到应用落地的闭环。在这一体系中,GPU不再只是被动执行计算任务,而是与模型架构形成更深层协同。

  这种“芯模联合定义”的路径,一旦形成,将在性能优化、成本控制以及迭代效率上形成复合优势,进而构筑更稳固的竞争壁垒。

  从需求侧看,这一布局亦有现实支撑。一方面,AI应用仍处于渗透初期,Token消耗随智能体等新形态快速增长,对算力的需求呈现持续性;另一方面,在国产替代与自主可控政策推动下,本土算力体系建设加速,为国产厂商提供了明确的市场空间。

  技术迭代、生态协同与市场扩张三者叠加,构成了壁仞科技未来增长的基本框架。

(文章来源:时代财经)

文章来源:时代财经 责任编辑:6
原标题:当算力开始按Token计价,这家芯片公司换了一种打法
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500