xiand.ai
科技

谷歌推出 TurboQuant 算法 宣称将 AI 内存需求降低六倍

谷歌近日发布名为 TurboQuant 的新压缩算法,声称能在不损失精度的情况下将 AI 内存需求降低六倍。这一技术突破可能缓解行业对存储芯片的急剧需求,导致相关厂商股价出现波动。

La Era

1 分钟阅读

Google TurboQuant Algorithm Reduces AI Memory Needs by Six Times
Google TurboQuant Algorithm Reduces AI Memory Needs by Six Times

谷歌近日在最新的技术博客中正式宣布推出名为 TurboQuant 的新型压缩算法。该技术旨在解决人工智能模型在向量量化过程中面临的内存开销挑战。根据官方声明,此算法能在不损失模型精度的情况下,将内存需求降低六倍。这一消息迅速引发了科技行业的广泛关注。该算法针对 AI 推理场景进行了优化,具有显著潜力。

向量压缩对于 AI 模型处理信息至关重要,因为它们使用向量来表示和理解数据。传统的压缩方法通常需要在文件大小和性能精度之间进行权衡。谷歌声称新算法实现了高压缩比的同时保持了零精度损失,这被视为一项技术突破。PC Gamer 报道指出,这对缓解当前存储芯片短缺可能有所帮助。行业一直寻求更高效的数据压缩方案。

该算法的技术核心在于改变了向量的计算参考系统。谷歌将向量从标准的笛卡尔坐标转换为极坐标,类似于用距离和角度代替方向指令。这种转换消除了传统方法所需的数据归一化步骤,从而减少了不必要的内存开销。通过这种数学变换,无需复杂的归一化过程。这种机制允许在不牺牲准确性的前提下优化数据表示。

市场对此消息反应迅速,主要存储芯片制造商的股价出现显著下跌。三星电子股价下跌了八%,SK 海力士下跌了十一%,美光科技下跌了十%。投资者推测这可能会减少人工智能公司对内存的采购量,从而影响营收预期。这些波动发生在消息公布后的几个交易日之内。存储芯片市场原本处于高需求周期,股价跌幅反映了投资者对未来的担忧。

当前人工智能基础设施面临巨大的内存需求压力,行业称之为内存危机。随着大模型参数量的增加,内存瓶颈成为制约性能的关键因素。大型语言模型的训练和推理需要消耗大量显存和系统内存。如果内存需求大幅下降,可能会缓解供应链的紧张状况,并降低数据中心运营成本。这被视为缓解所谓内存危机的一种潜在技术途径。

然而,行业内部对此仍持保留态度。美光表示,未来一段时间内芯片需求仍远超其可用供应量。这意味着释放的产能可能仍会被新的 AI 服务器需求吸收,而非流向消费级市场。此外,伊朗战争等事件也对材料供应造成了影响,使得情况更为复杂。供应链的复杂性不容忽视,部分产能可能优先供应 AI 服务器。

此外,技术公司可能会利用节省的内存运行更大规模的模型。这被称为弹性需求,即硬件能力提升后,软件需求也随之扩大。因此,消费者是否能受益于更便宜的内存尚不确定,需等待实际市场反馈。效率提升往往带来更大的使用量。这种趋势可能导致整体内存消耗量并未减少。

如果 AI 公司确实减少采购,普通 PC 和笔记本电脑的存储成本可能会下降。这对于游戏玩家和硬件爱好者来说是一个潜在的利好消息。DDR5 内存的价格波动可能因此受到影响,进而改变硬件市场的格局。个人计算设备的存储配置也可能随之调整。消费者可能会看到更实惠的硬件选择。

谷歌已在多个基准测试中展示了其成果,声称实现了完美的下游结果。该技术允许构建和查询大型向量索引,同时保持最小内存占用。这种转变被视为高维搜索领域的重大进步,可能改变服务器硬件架构。谷歌强调在保持精度的同时,预处理时间的缩短也是其宣称的优势之一。为大规模应用提供了可能性。

行业观察人士将继续关注这一技术对供应链的长期影响。内存市场的供需平衡可能会因此发生微妙变化。最终效果取决于算法在实际生产环境中的表现和广泛采用情况。技术验证过程需要时间。我们需观察实际部署后的数据。随着更多企业评估该技术,市场反应将更加清晰。

评论

评论存储在您的浏览器本地。