🚀
谷歌推出新AI压缩算法“TurboQuant”,可将模型推理阶段内存需求降低至少6倍,显著压缩键值缓存(KV Cache)占用空间,同时保持性能与精度。该技术通过PolarQuant极坐标转换与QJL量化纠错实现高效压缩,已在NVIDIA H100上实现8倍计算加速。受此影响,三星、SK海力士、铠侠、美光等全球主要内存厂商股价大幅下跌,其中SK海力士一度跌6.4%。但高带宽内存(HBM)受影响较小
编辑 IN IN 美国 海湾合作委员会(GCC) 英语 英语 हिन्दी मराठी ಕನ್ನಡ தமிழ் বাংলা മലയാളം తెలుగు ગુજરાતી
天气 登录
TOI 今日电子报 直播 新闻
来源:
AI人工智能科技行业动态
