返回资讯列表
行业动态

下载速递:零工经济培训人形机器人,AI评估标准再升级

Thomas Macaulay2026/05/06-179,812 阅读
🚀

【摘要】零工经济从业者正为类人机器人提供真实生活视频数据,如尼日利亚学生泽乌斯等通过录制家务视频参与训练,Micro1已在全球50余国招募数千名数据采集员,引发隐私与伦理争议;与此同时,AI评估标准亟待革新——当前以孤立任务为主的测试方式无法反映现实应用复杂性,学者提出“人—AI协同、情境适配型评估”新框架;OpenAI完成硅谷史上最大规模融资;量子计算在医疗健康领域受关注,Infleqtion公

《下载》(The Download) ——“零工经济”从业者正为类人机器人提供训练数据,AI评估基准亟待革新

此外:OpenAI刚刚完成了硅谷有史以来规模最大的融资轮次。

作者:托马斯·麦卡勒姆(Thomas Macaulay) 存档页面 2026年4月1日

这是今日《下载》(The Download)的推送——我们每周工作日的新闻简报,为您呈现科技世界每日动态。

在家中为类人机器人“打工”的零工经济从业者

当尼日利亚一名医学院学生泽乌斯(Zeus)结束漫长的一天医院工作、回到公寓时,他将iPhone固定在额头上,开始录制自己做家务的视频。

泽乌斯是初创公司Micro1的数据采集员,该公司将他所收集的视频数据出售给机器人企业。随着各大公司竞相研发类人机器人,这类由全球各地“零工”提供的真实生活视频,已成为训练机器人最热门的新方式。

截至目前,Micro1已在50多个国家招募了数千名此类数据采集者,包括印度、尼日利亚和阿根廷等国。这些岗位在当地薪酬可观,但同时也引发了关于隐私保护与知情同意的严峻伦理问题——工作本身既具挑战性,又令人感到怪异。

完整报道请见→

——米歇尔·金(Michelle Kim)

我们的读者近期投票将“类人机器人”列为2026年度十大突破性技术榜单中的第11项(

查看其他正式入选的技术项目→

当前AI评估标准已失灵——我们需要怎样的新基准?

数十年来,人工智能的性能评估一直聚焦于其是否能在孤立任务中超越人类。然而,在现实世界中,AI极少以这种方式被使用。

当AI在理想化、封闭的环境中接受测试时,它却需在复杂、混乱、多人协作的长期场景中持续运行。这种评估环境与实际应用之间的错位,导致我们对AI的能力、风险及社会影响产生误判。

我们亟需建立新的评估基准,用以衡量AI在更长周期内、嵌入人类团队、工作流程与组织架构中的综合表现。为此,我们提出一种可行方案:

人—AI协同、情境适配型评估(Human–AI, Context-Specific Evaluation)

——安吉拉·阿瑞斯蒂杜(Angela Aristidou),伦敦大学学院教授,斯坦福数字经济学实验室及斯坦福以人为中心的人工智能研究所(Stanford Human-Centered AI Institute)研究员

MIT科技评论播客栏目《MIT Technology Review Narrated》最新上线:量子计算机能否解决医疗健康难题?答案即将揭晓。

在牛津城郊一处实验室里,一台由原子与光子构建而成的量子计算机静待启用。这台设备虽小巧却威力强大,且价值不菲。拥有该设备的公司Infleqtion,正寄望于其能力赢得一项高达500万美元的竞赛奖金。

此次竞赛旨在遴选能解决“经典计算机无法处理”的真实医疗健康问题的量子计算机——但最终仅有一台设备可胜出(若真有胜者的话)。

——迈克尔·布鲁克斯(Michael Brooks)

本篇内容已改编为MIT科技评论播客栏目《MIT Technology Review Narrated》,每周一在Spotify与Apple Podcasts平台同步更新。您只需在任一平台搜索“MIT Technology Review Narrated”,即可关注我们,第一时间收听所有新发布内容。

今日必读精选

我已从网络中精选出今日最具趣味性、重要性、警示性或启发性的科技热点故事,供您参考:

1

来源:Thomas Macaulay

AI人工智能科技行业动态