AI想替代谁?谁愿意被替代?北大校友的研究首次揭示数据真相!
1769年,瓦特改进了蒸汽机。
1945年,计算机诞生。
2001年,3G移动网络开始部署。
这些发明创新彻底改变了人的生活:从农田到工厂,从体力劳动到脑力劳动,从线下工作到线上工作。
2025年,AI智能体来了。这次是好是坏?
AI智能体将带来规模最大的职场变革:仅在美国,就有多达7000万名工人即将面临这场变革。
但几乎从来没有人关心他们真正的想法。
在AI加速自动化各种工作的时代,斯坦福大学的研究团队选择了另一种路径:研究美国劳动力中,工人们的意愿与 AI 能力之间的差距。
论文链接:https://arxiv.org/abs/2506.06576
博客链接:https://futureofwork.saltlab.stanford.edu/
这次,团队有3大研究发现:
这是跨学科研究团队:
计算机:Yijia Shao,Humishka Zope,Yucheng Jiang,杨笛一(Diyi Yang)
数字经济:David Nguyen, Erik Brynjolfsson
计算机+数字经济:Jiaxin Pei
团队建立了基于调查的严谨评估框架,用于摸清在全美各职业中,AI智能体实现「自动化」和「增强人类能力」的潜力。
利用美国劳工部的数据库,他们开展了以下工作:
基于这些数据,研究人员构建了「AI智能体从业者前景与准备度知识库」(Worker Outlook & Readiness Knowledge Bank,WORKBank)。
如果不从事AI相关工作,为什么你也应该关心这件事?
因为AI的「真香定律」:「你可能对AI不感兴趣,但AI终将对你产生兴趣。」
为了指导未来AI智能体的研发,并帮助研究人员人类为未来的工作做好准备,团队正式发布了WORKBank数据库的第一个版本。
AI正在职场引发革命!
2023年,OpenAI等机构的研究表明,约80%的美国劳动者可能面临大语言模型(LLM)影响其至少10%的工作任务,其中19%的劳动者超过半数职责或将受到冲击。
论文链接:https://arxiv.org/abs/2303.10130
2025年初,Anthropic分析了LLM使用数据,结论进一步显示:
在36%的职业中,AI工具已活跃应用于至少25%的工作任务。
论文链接:https://arxiv.org/abs/2503.04761
对普通打工人而言,AI到底是福是祸?
这一次AI专家携手经济学家,直接从一线从业者反馈获取洞见。
他们提出了双视角的审计框架:
一是工人希望AI承担哪些任务,
二是专家评估AI实际上能胜任哪些任务。
为了帮助参与者准确表达想法,问卷设计了有逻辑引导的问题,并加入音频访谈,方便他们结合实际工作经验回答。
基于这个框架,研究团队构建了WORKBank数据库,用数据全面描绘需求和影响:
· 工人的实际需求
· 任务能否被AI接手的图谱(意愿—能力分布)
· 不同任务对人类参与程度的要求(HAS等级)
· 这些变化可能对人类核心技能产生的影响
图1:审计框架概览与关键发现
利用AI对工人语音回答进行归类,研究人员总结了AI自动化最常见的三大担忧:
从行业来看,艺术、设计与媒体领域的抵触情绪最明显——
在这些领域里,只有17.1%的任务得到了工人的正面自动化评价。这说明,在更依赖创造力与情感表达的工作中,工人对AI的接受度更低。
研究团队发现,在约46.1%的任务中,正在从事这些工作的工人表示「愿意让AI来做」。
即便是在被提醒要考虑「失业风险」或「工作变得无聊」之后,他们依然在问卷中打了超过3分(满分5分)的支持评分,说明这些任务更容易被接受自动化。
自动化意愿评分在任务中的分布。纵轴为工人对任务自动化的意愿评分(1到5分),横轴为844项任务的排名
上图显示,有46.1%的任务评分高于3分,表示工人对这些任务由AI自动完成持积极态度。
排名前3的任务包括:
评分最低的3个任务则是:
研究团队调查了支持自动化的工人为什么愿意让AI来帮忙——通过多选题和自由回答两种方式。
最常见的理由是:「可以把时间腾出来,去做更有价值的工作」,这项理由被69%的人选中。
其他常见原因包括:任务太重复(47%)、太累太有压力(26%)、或者希望通过AI提升工作质量(47%)。
从工人和专家的评分对比中,研究人员把任务大致分成了四个区域:
意愿—能力图谱
这张「意愿—能力图谱」帮助识别出哪些任务值得重点投入。
但当把YC旗下的创业公司与这些任务匹配时,研究人员发现:目前的投资并未优先关注「绿灯区」或「研发机会区」。反而有约41%的YC公司集中在「红灯区」或「低优先级区」这些不太受欢迎或技术难度高的任务。
换句话说,许多「技术可行+工人也欢迎」的任务,其实并没有得到应有的重视。
这提醒我们:AI的发展不仅要看技术本身,也要看人们真正想要什么。
AI智能体对工作的影响并非简单的「自动化」或「非自动化」这样的二选一问题。
为此,研究人员引入了「人类能动性等级」(Human Agency Scale):包含 5 个等级的量表,涵盖了从「完全自动化」到「人机协作增益」之间的各种状态——
在后一种状态下,技术主要用于补充和增强人类的能力。
H1:AI能完全独立完成任务,无需人参与。
H2:AI能完成大部分任务,偶尔需要人类输入。
H3:AI和人类平等协作,效果优于任何一方单独完成。
H4:AI必须依赖人类才能完成任务。
H5:AI无法独立完成任务,必须全程由人主导。
这一等级体系不是说「越高越好」,而是用来匹配不同任务的实际需求。
下图2展示了这五个等级在不同任务中的具体例子,比如哪些任务适合完全交给 AI,哪些则需要人机长期协作。
HAS不仅能让人更清楚地理解「AI适合做什么」,也为打工人准备未来技能、开发者设计更合理的AI智能体提供了清晰的参考。
总体上,工人更倾向于较高水平的人类参与,这可能预示着随着AI能力增强,会产生一定的摩擦。
在调查的104种职业中,有47种工人最倾向的等级是H3——也就是「人机平等协作」。
这说明,很多工人并不想让AI全面接管工作,而是希望AI成为有力的合作伙伴。
不过,也出现了值得注意的现象:在将近一半(47.5%)的任务中,工人希望的「人类参与度」远超专家估计。
更极端的是,有16.4%的任务,工人希望的等级高出专家评估两个档次。这意味着,哪怕AI已经技术上「能做」,很多工人还是不放心、不愿放手。
人类能动性程度在同一职业内部也存在差异,有些任务适合自动化,有些则不然。
这也提醒开发者:在设计AI智能体时,不能一刀切。
并不是所有类型的工作都会同样受到AI的影响。
为了理解未来工作的走向,以及哪些技能将变得最有价值,研究团队进一步利用 WORKBank数据库来分析人类技能的变化趋势。
最后发现了三项可能影响未来人类工作的趋势:
Yijia Shao是斯坦福大学的博士生,师从杨笛一教授。
此前,她在北京大学元培学院获得学士学位。
她曾在微软亚洲研究院、谷歌Tensorflow Lite团队实习。
她的研究方向为机器学习与自然语言处理。
参考资料:
https://x.com/EchoShao8899/status/1933178209484603725
https://arxiv.org/abs/2506.06576
https://www.linkedin.com/feed/update/urn:li:activity:7338949272769282053/
https://futureofwork.saltlab.stanford.edu/
文章来自于“新智元”,作者“KingHZ”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT