“全球大模型第一股”智谱股价2月20日暴涨超40%。次日,这家AI公司却发出致歉信。

在2月21日发布的《GLM Coding Plan致歉信》中,智谱承认了在GLM-5发布后犯下了三个关键错误:
首先,规则透明度不足:为应对GLM-5更高的算力消耗,公司设计了分层使用策略,将高峰期消耗提升至3倍、非高峰期2倍,但未向用户清晰说明,导致“消耗变快”的普遍抱怨。
其次,灰度节奏太慢:GLM-5发布后流量远超预期,叠加灰产号池和黄牛党恶意占用资源,公司扩容节奏滞后,不得不按Max、Pro、Lite的顺序分阶段开放,导致大量Pro和Lite用户无法正常使用。目前,Max用户已经全面开放,Pro用户虽已开放,但高峰期可能会因集群负载较高遇到限流,Lite用户将会在节后非高峰期逐步灰度开放。为优化用户体验、智谱给出了对应的补偿方案。针对受到影响的Lite和Pro用户,智谱支持自主申请退款。包括Max用户在内的已经用上GLM-5的用户,及继续选择智谱的用户,智谱统一为其延长15天使用期。
最后,老用户升级机制粗糙:部分老用户在2月12日至16日期间误升级到新套餐,权益受损。
GLM Coding Plan是智谱专门为AI编程场景推出的付费订阅套餐服务,开发者订阅后,可以使用智谱提供的大模型来辅助写代码。
智谱之所以致歉,正是因为其新模型GLM-5的强劲表现,致使需求暴增超出其承载能力。测试显示,GLM-5在代码能力、智能体表现等关键领域的开源模型评分中取得SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务。
智谱AI的事件并非孤例。去年,Anthropic的Claude 3.5发布时,也曾因流量爆表而被迫对Pro用户实施限额。大模型从实验室走向市场的过程中,服务能力和商业化运营能力,正变得与技术实力同等重要。
在算力保障层面,记者注意到,智谱于2月16日发布了全网寻找“算力合伙人”的计划。近期,由于全球范围内对GLM-5的需求激增,并发访问量突破了既有规划的上限,导致服务出现排队、响应延迟及卡顿现象,影响到部分用户的体验。
智谱称,尽管公司已经多次对国产芯片集群进行扩容,并限量发售了GLM Coding Plan套餐,但依然无法彻底解决当前供不应求的局面。为了给用户提供更极致的智能体验,智谱启动了“算力合伙人”招募计划。

一是芯片厂商,智谱愿开放核心技术接口,联合开展针对GLM-5的底层优化;二是算力伙伴与推理服务商,共建更高并发、更低延迟的推理网络;三是其他形式的算力合作。
此前GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等7家主流国产芯片平台的深度推理适配与算子级优化,能够在国产算力集群上实现高吞吐、低延迟的稳定运行。
(文章来源:广州日报)