谷歌新算法声称能“6倍压缩KV缓存” 美股存储板块承压走弱
2026年03月26日 05:34
来源: 财联社
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

K图 GOOGL_0

K图 GOOG_0

  周三美股开盘后,在大盘情绪尚可的背景下,存储板块却反向走弱。截至收盘,美光科技跌3.40%、闪迪跌3.50%,西部数据希捷科技也一同下跌

image

  对于今日的市场异动,有多处信源均将矛头指向了谷歌。AI巨头早些时候推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant

image

  根据谷歌介绍,TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着上下文窗口变大,这些缓存正成为主要的内存瓶颈。

  TurboQuant可在无需重新训练或微调模型的情况下,将键值缓存压缩至3bit精度,同时基本保持模型准确率不受影响。对包括Gemma、Mistral等开源模型的测试显示,该技术可实现约6倍的键值缓存内存压缩效果

image

  此外,在英伟达H100加速器上的测试结果显示,与未量化的键向量相比,该算法最高可实现约8倍性能提升。研究人员也表示,这项技术的应用不局限于AI模型,还包括支撑大规模搜索引擎的向量检索能力。

  谷歌计划于4月的国际学习表征会议(ICLR 2026)上展示TurboQuant技术。

  不难看出,虽然该技术的应用前景目前仍需要打一个问号,但市场已经开始交易内存需求前景转变的预期。

  对于最新变化,富国银行TMT分析师Andrew Rocha解读称:“随着上下文窗口不断扩大,KV缓存中的数据存储规模呈爆炸式增长,从而推高对内存容量的需求。而TurboQuant正是在直接压缩这一成本曲线。如果该技术能够得到广泛采用,这对内存成本曲线而言将是利好。

  Rocha同时表示,这项技术可能影响未来对内存容量规格的需求判断。

  他写道:“如果实现这些AI应用所需的内存规格被显著降低,那么市场很快就会重新评估究竟还需要多少内存容量。”

  不过Rocha也指出,目前仍不清楚该技术是否仅适用于谷歌自身体系,或能否推广至其他AI实验室。此外,实验室环境下的测试结果是否能够顺利转化为真实生产环境中的应用表现,也存在不确定性。

  值得一提的是,作为搅动存储板块的事主,谷歌也没捞着什么好处。公司股价在周三一度跌破290美元,据2月初创下的349美元历史高点已经回撤近17%,距离20%的关键心理位置也只有咫尺之遥。

image

  东财图解·加点干货

(文章来源:财联社)

文章来源:财联社 责任编辑:73
原标题:谷歌新算法声称能“6倍压缩KV缓存” 美股存储板块承压走弱
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500