或延迟3个月交付 英伟达新一代 Blackwell GPU 被曝存过热问题
财中社11月18日电 当地时间周日,The Information报道,英伟达新一代 Blackwell 处理器在高容量服务器机架中存在严重的过热问题。这些问题导致设计调整与项目延期,使谷歌、Meta和微软等主要客户对能否按计划部署Blackwell服务器感到担忧。
知情人士透露,Blackwell GPU专为AI和高性能计算(HPC)设计,但在配置72个处理器的服务器中出现过热问题,此类服务器每个机架功耗最高可达120千瓦。过热问题迫使英伟达多次修改机架设计,不仅限制了GPU性能,还可能损坏硬件。客户因此担心,这些技术问题会延迟数据中心的处理器部署进程。
报道称,据一直致力于解决这一问题的英伟达员工以及了解这一问题的客户和供应商称,这家芯片制造商已多次要求其供应商改变机架设计,以解决过热问题,但报道并未透露供应商的名字。
“英伟达正在与领先的云服务提供商合作,这是我们工程团队和流程不可或缺的一部分。工程迭代是正常的,也是意料之中的。”该公司发言人在给媒体的一份声明中表示。
10月份,英伟达CEO黄仁勋表示,在长期合作伙伴台积电的帮助下,英伟达最新款Blackwell AI芯片的设计缺陷已经修复。他当时预计,Blackwell芯片将在第四季度发货。而如今据媒体预计,改良后的Blackwell GPU最快于明年1月底才能出货。这也即是说,新一代Blackwell处理器或将因发热而延迟3个月才能交付。
(文章来源:财中社)