2026年3月,TechCrunch《Equity》播客专访Arena(原LM Arena)联合创始人,揭秘其从伯克利博士项目快速成长为估值17亿美元独角兽的历程。Arena已成为大语言模型评测的事实标准,影响融资、发布节奏与公关策略。节目探讨其“结构性中立”机制——如何在自身评估企业同时又是投资方的复杂背景下保持客观;解析其对抗“刷分”的设计;介绍面向企业的新型测评产品,涵盖智能体、编程及真实任
成为AI行业评委的博士生们
作者:Rebecca Bellan、Theresa Loconsolo 发布时间:2026年3月18日
收听方式: 在 Apple Podcasts 收听 在 Spotify 收听
人工智能模型正以惊人的速度涌现,行业竞争日趋激烈。面对众多入局者,究竟哪一款模型最出色?又由谁来判定这一结果?“Arena”(原名LM Arena)已悄然成为前沿大语言模型(LLM)领域的事实标准公开排行榜,其影响力已延伸至融资决策、产品发布节奏及公关传播周期。短短七个月内,这家初创公司便从加州大学伯克利分校的一场博士研究项目,跃升为估值达17亿美元的独角兽企业。
在TechCrunch旗下旗舰播客《Equity》本期节目中,记者Rebecca Bellan专访了Arena联合创始人Anastasios Angelopoulos与Wei-Lin Chiang,探讨他们如何在自身所评估的企业同时也是其投资方的复杂背景下,构建一个真正中立的基准评测体系。
完整收听本期节目,您将了解:
- Arena的实际运作机制,以及其创始团队为何坚称:你无法像对待静态基准那样轻易“刷分”或“钻空子”; - 所谓“结构性中立”究竟意味着什么?从OpenAI、谷歌和Anthropic等公司获取资金,是否构成利益冲突? - Arena正如何突破传统对话场景,推出面向企业的新产品,对智能体(agents)、编程能力及真实世界任务进行综合测评; - 为何目前Claude在法律与医疗领域专家级评测榜单上暂居榜首; - Arena对未来技术路径的押注——即在大语言模型之后,智能体(agents)将成为下一轮竞赛的核心焦点。
欢迎订阅《Equity》播客: YouTube | Apple Podcasts | Overcast | Spotify 及所有主流播客平台 您也可关注Equity的社交媒体账号(@EquityPod),包括X平台与Threads。
作者简介: Rebecca Bellan 资深记者 Rebecca Bellan是TechCrunch的资深记者,专注报道塑造人工智能发展的商业格局、政策动向及新兴趋势。她的作品亦曾见于《福布斯》《彭博新闻社》《大西洋月刊》《每日野兽》等多家知名媒体。
如需联系或验证Rebecca的联络信息,请发送邮件至 rebecca.bellan@techcrunch.com,或通过Signal加密通讯工具联系:rebeccabellan.491。
Theresa Loconsolo 音频制作人 Theresa Loconsolo现为TechCrunch音频部门成员,专注于《Equity》播客的策划与制作。2022年加入TechCrunch前,她曾任职于一家四台广播集团,负责内容创作、录制、配音、剪辑,并参与现场演出及嘉宾访谈(如乐队lovelytheband)。Theresa居住于新泽西州,拥有蒙茅斯大学传播学学士学位。
如需联系或核实Theresa的联络信息,请发送邮件至 theresa.loconsolo@techcrunch.com。
来源:Rebecca Bellan, Theresa Loconsolo
