
新智元报道
新智元报道
【新智元导读】AI想替代谁?谁愿意被替代?北大校友的研究首次揭示数据真相!
1769年,瓦特改进了蒸汽机。
1945年,计算机诞生。
2001年,3G移动网络开始部署。
这些发明创新彻底改变了人的生活:从农田到工厂,从体力劳动到脑力劳动,从线下工作到线上工作。
2025年,AI智能体来了。这次是好是坏?
AI智能体将带来规模最大的职场变革:仅在美国,就有多达7000万名工人即将面临这场变革。
但几乎从来没有人关心他们真正的想法。

在AI加速自动化各种工作的时代,斯坦福大学的研究团队选择了另一种路径:研究美国劳动力中,工人们的意愿与 AI 能力之间的差距。

论文链接:https://arxiv.org/abs/2506.06576
博客链接:https://futureofwork.saltlab.stanford.edu/
这次,团队有3大研究发现:
-
职场AI智能体的需求-能力分布图揭示了AI研究的关键错配现象:41.0%的Y Combinator企业任务集中在低优先级区和自动化「红灯」区
-
众多任务需要人机对等协作,但从业者普遍期望更高程度的人类主导权,这一矛盾可能引发摩擦
-
若AI智能体开始进入劳动力市场,人类核心能力或将转向人际交往与组织协调技能。

这是跨学科研究团队:
计算机:Yijia Shao,Humishka Zope,Yucheng Jiang,杨笛一(Diyi Yang)
数字经济:David Nguyen, Erik Brynjolfsson
计算机+数字经济:Jiaxin Pei
团队建立了基于调查的严谨评估框架,用于摸清在全美各职业中,AI智能体实现「自动化」和「增强人类能力」的潜力。
利用美国劳工部的数据库,他们开展了以下工作:
-
调查了104个职业领域的1500名行业专家
-
招募了52名AI研究员和开发者来评估当前AI智能体的能力
基于这些数据,研究人员构建了「AI智能体从业者前景与准备度知识库」(Worker Outlook & Readiness Knowledge Bank,WORKBank)。
如果不从事AI相关工作,为什么你也应该关心这件事?
因为AI的「真香定律」:「你可能对AI不感兴趣,但AI终将对你产生兴趣。」
为了指导未来AI智能体的研发,并帮助研究人员人类为未来的工作做好准备,团队正式发布了WORKBank数据库的第一个版本。

AI正在职场引发革命!
2023年,OpenAI等机构的研究表明,约80%的美国劳动者可能面临大语言模型(LLM)影响其至少10%的工作任务,其中19%的劳动者超过半数职责或将受到冲击。

论文链接:https://arxiv.org/abs/2303.10130
2025年初,Anthropic分析了LLM使用数据,结论进一步显示:
在36%的职业中,AI工具已活跃应用于至少25%的工作任务。

论文链接:https://arxiv.org/abs/2503.04761
对普通打工人而言,AI到底是福是祸?
这一次AI专家携手经济学家,直接从一线从业者反馈获取洞见。
他们提出了双视角的审计框架:
一是工人希望AI承担哪些任务,
二是专家评估AI实际上能胜任哪些任务。
为了帮助参与者准确表达想法,问卷设计了有逻辑引导的问题,并加入音频访谈,方便他们结合实际工作经验回答。
基于这个框架,研究团队构建了WORKBank数据库,用数据全面描绘需求和影响:
· 工人的实际需求
· 任务能否被AI接手的图谱(意愿—能力分布)
· 不同任务对人类参与程度的要求(HAS等级)
· 这些变化可能对人类核心技能产生的影响

图1:审计框架概览与关键发现

为何不愿让AI智能体介入工作?
利用AI对工人语音回答进行归类,研究人员总结了AI自动化最常见的三大担忧:
-
45%表示:不信任AI系统的准确性、能力或可靠性;
-
23%担心:AI会取代自己的工作;
-
16.3%认为:AI缺乏「人味」,无法做到人类那种沟通、理解与判断。
从行业来看,艺术、设计与媒体领域的抵触情绪最明显——
在这些领域里,只有17.1%的任务得到了工人的正面自动化评价。这说明,在更依赖创造力与情感表达的工作中,工人对AI的接受度更低。

哪些任务愿意让AI来做?
研究团队发现,在约46.1%的任务中,正在从事这些工作的工人表示「愿意让AI来做」。
即便是在被提醒要考虑「失业风险」或「工作变得无聊」之后,他们依然在问卷中打了超过3分(满分5分)的支持评分,说明这些任务更容易被接受自动化。

自动化意愿评分在任务中的分布。纵轴为工人对任务自动化的意愿评分(1到5分),横轴为844项任务的排名
上图显示,有46.1%的任务评分高于3分,表示工人对这些任务由AI自动完成持积极态度。
排名前3的任务包括:
-
报税员:安排客户预约(5.00分)
-
公共安全通信员:维护紧急呼叫相关信息档案(4.67分)
-
考勤文员:记录并调整因错误造成的工资问题(4.60分)
评分最低的3个任务则是:
-
编辑:撰写文章、社论或通讯稿(1.60分)
-
物流分析师:联系供应商了解物料情况(1.50分)
-
售票与旅行服务员:追踪客户行李丢失或延误情况(1.50分)
为什么工人希望让AI来接手工作?
研究团队调查了支持自动化的工人为什么愿意让AI来帮忙——通过多选题和自由回答两种方式。
最常见的理由是:「可以把时间腾出来,去做更有价值的工作」,这项理由被69%的人选中。
其他常见原因包括:任务太重复(47%)、太累太有压力(26%)、或者希望通过AI提升工作质量(47%)。

从工人和专家的评分对比中,研究人员把任务大致分成了四个区域:
-
绿灯区:工人想交给AI,AI技术也能胜任。是最理想的自动化对象,有望带来效率与社会效益双赢。
-
红灯区:AI技术没问题,但工人不愿意。这类任务部署AI要小心,容易引发抵触或更大争议。
-
研发机会区:工人很希望AI来做,但现在AI还做不到。是未来技术突破的重点方向。
-
低优先级区:工人不想交给AI,AI也还做不到。暂时不是AI发展的重点。

意愿—能力图谱
这张「意愿—能力图谱」帮助识别出哪些任务值得重点投入。
但当把YC旗下的创业公司与这些任务匹配时,研究人员发现:目前的投资并未优先关注「绿灯区」或「研发机会区」。反而有约41%的YC公司集中在「红灯区」或「低优先级区」这些不太受欢迎或技术难度高的任务。

换句话说,许多「技术可行+工人也欢迎」的任务,其实并没有得到应有的重视。
这提醒我们:AI的发展不仅要看技术本身,也要看人们真正想要什么。

AI智能体对工作的影响并非简单的「自动化」或「非自动化」这样的二选一问题。
为此,研究人员引入了「人类能动性等级」(Human Agency Scale):包含 5 个等级的量表,涵盖了从「完全自动化」到「人机协作增益」之间的各种状态——
在后一种状态下,技术主要用于补充和增强人类的能力。
H1:AI能完全独立完成任务,无需人参与。
H2:AI能完成大部分任务,偶尔需要人类输入。
H3:AI和人类平等协作,效果优于任何一方单独完成。
H4:AI必须依赖人类才能完成任务。
H5:AI无法独立完成任务,必须全程由人主导。
这一等级体系不是说「越高越好」,而是用来匹配不同任务的实际需求。
下图2展示了这五个等级在不同任务中的具体例子,比如哪些任务适合完全交给 AI,哪些则需要人机长期协作。

HAS不仅能让人更清楚地理解「AI适合做什么」,也为打工人准备未来技能、开发者设计更合理的AI智能体提供了清晰的参考。
总体上,工人更倾向于较高水平的人类参与,这可能预示着随着AI能力增强,会产生一定的摩擦。
在调查的104种职业中,有47种工人最倾向的等级是H3——也就是「人机平等协作」。
这说明,很多工人并不想让AI全面接管工作,而是希望AI成为有力的合作伙伴。

不过,也出现了值得注意的现象:在将近一半(47.5%)的任务中,工人希望的「人类参与度」远超专家估计。
更极端的是,有16.4%的任务,工人希望的等级高出专家评估两个档次。这意味着,哪怕AI已经技术上「能做」,很多工人还是不放心、不愿放手。

人类能动性程度在同一职业内部也存在差异,有些任务适合自动化,有些则不然。
这也提醒开发者:在设计AI智能体时,不能一刀切。


并不是所有类型的工作都会同样受到AI的影响。
为了理解未来工作的走向,以及哪些技能将变得最有价值,研究团队进一步利用 WORKBank数据库来分析人类技能的变化趋势。
最后发现了三项可能影响未来人类工作的趋势:
-
对信息处理类技能的需求正在减弱。它们在那些人类参与度高的任务中出现较少。
-
人际沟通与组织管理类技能正变得更重要。它们在高HAS等级的任务中更为常见。
-
高人类参与度的技能涵盖多种维度。平均人类参与度最高的前十项技能,跨越了人际、组织、决策与判断等多个方面。


Yijia Shao是斯坦福大学的博士生,师从杨笛一教授。
此前,她在北京大学元培学院获得学士学位。

她曾在微软亚洲研究院、谷歌Tensorflow Lite团队实习。
她的研究方向为机器学习与自然语言处理。
(文:新智元)