返回资讯列表
创业动态

Gimlet Labs以优雅方式破解AI推理瓶颈

2026/05/06-70,417 阅读
📰

斯坦福大学兼职教授扎因·阿斯加尔(Zain Asgar)联合创始人创立的初创公司Gimlet Labs完成8000万美元A轮融资,由门洛风险投资领投。该公司推出全球首个“多芯片推理云”软件系统,可将AI工作负载智能拆分并跨CPU、GPU及高内存系统等异构硬件并行部署,解决推理性能瓶颈。其核心价值在于协调多种硬件资源——如解码用内存密集型设备、工具调用依赖网络带宽——实现算力利用率从当前15%–30

斯坦福大学兼职教授、成功退出创业者的扎因·阿斯加尔(Zain Asgar)刚刚为一家初创公司完成了8000万美元的A轮融资,以解决AI推理环节中的性能瓶颈问题——该公司采用了一种精妙而高效的方式攻克这一难题。本轮融资由门洛风险投资(Menlo Ventures)领投。

这家名为Gimlet Labs的公司,宣称打造了全球首个且唯一的“多芯片推理云”(multi-silicon inference cloud),其核心是一套软件系统,可使AI工作负载在多种异构硬件上并行运行:既包括传统CPU,也涵盖专为AI优化的GPU,以及高内存配置的计算系统。

Asgar在接受TechCrunch采访时指出:“我们本质上是在利用一切可用的不同硬件资源。”

据领投方门洛风险投资的合伙人蒂姆·塔利(Tim Tully)在其博客中所写,单个智能体(agent)可能需串联执行多个步骤,而每一步对硬件的要求各不相同:“推理是计算密集型任务;解码是内存密集型任务;工具调用则主要受限于网络带宽。”

他进一步强调:“没有一款芯片能包揽所有功能;但随着新型硬件陆续推出,老旧GPU得以重新部署,‘多芯片舰队’已准备就绪——唯独缺一个能让它们协同工作的软件层。”而这正是Tully认为Gimlet Labs所提供的关键价值所在。

若当前‘部署更多算力’的趋势持续下去,麦肯锡(McKinsey)预测,到2030年,数据中心相关支出将累计逼近7万亿美元。Asgar指出,目前大多数AI应用仅在已部署硬件上运行了“15%至30%的时间”。

“换一种说法就是:你正白白浪费数百亿美元,因为大量算力资源长期处于闲置状态。”他说,“我们的目标,就是让AI工作负载的效率较如今提升10倍。”

来源:

AI人工智能科技创业动态