2025 年已经走到了尾声。
关注 AI 圈的读者们都知道,今年是各路 AI 巨头神仙打架的一年,是人才大战架构重组极其频繁的一年,是大模型军备竞赛出奇白热化的一年,也是 AI 基础设施建设如火如荼的一年……
在这精彩绝伦的一年的结尾,我们的老朋友:斯坦福大学计算机科学客座教授,前百度 AI 负责人,前谷歌大脑负责人吴恩达老师,发表了今年的保留节目:一封信,和一篇 2025 的人工智能领域年度总结。

元旦假期将至,学生们美妙的寒假以及春节假期也近在眼前。「永远不要停止学习」是假期前的老生常谈,尤其是希望在蓬勃进化的,高度竞争的人工智能领域内谋求发展机会的人。应当做什么,怎么做,吴恩达在今年的信中给出了他的见地。
亲爱的朋友们:
又一年,AI 以惊人的速度向前推进,为所有人 —— 包括刚进入这个领域的新手 —— 创造了前所未有的软件开发机会。事实上,许多公司现在最大的困扰之一,就是找不到足够多真正懂 AI 的工程师。
每年冬季假期,我都会留出一段时间来学习和动手构建项目,希望你们也能如此。这不仅能帮助我打磨已有技能、掌握新知识,也能实实在在地推动你的技术职业发展。
要真正具备构建 AI 系统的能力,我建议你做到三点:
下面我解释为什么这三点都如此重要。
我常听到一些开发者建议别人:「别学了,直接上手做就行。」这是非常糟糕的建议!除非你已经身处一个经验丰富的 AI 开发者社群中,否则在没有理解 AI 基础的情况下贸然动手,很容易导致你重复发明轮子,或者更糟糕的是,把轮子重新发明得一团糟。
举个例子,在面试中,我见过不少候选人:自己重新发明了一套标准的 RAG 文档切分策略;重复实现了已经成熟的 Agentic AI 评估方法;写出了结构混乱、难以维护的 LLM 上下文管理代码。如果他们提前上过几门相关课程,就会更清楚哪些「积木」已经存在于行业中。他们当然仍然可以选择从零实现这些模块,甚至发明出比现有方案更好的方法,但至少能避免浪费数周时间走弯路。
因此,结构化学习至关重要。
而且说实话,我个人觉得上课非常有趣。与其看 Netflix,我更愿意随时打开一门优秀 AI 讲师的课程来学习。
同时,仅仅上课是不够的。有许多重要的经验,只有通过亲手实践才能真正学到。学习飞机是如何运作的理论,对于成为一名飞行员当然非常重要,但从来没有人只靠上课就学会开飞机。在某个时刻,真正坐进驾驶舱是不可或缺的!好消息是:随着高度智能化(highly agentic)的编程助手出现,动手构建的门槛已经比以往任何时候都低。而当你开始学习 AI 的各种构建模块时,它们常常会激发你对「还能做些什么」的新想法。如果我一时找不到项目灵感,我通常会去上几门课,或者读一些研究论文。这样坚持一段时间后,我总会冒出一大堆新的项目想法。而且,说实话,我觉得「做东西」本身真的很有趣,也希望你能体会到这种乐趣!
最后,并不是每个人都必须这样做,但我发现如今就业市场上最强的一批候选人,几乎都会偶尔阅读研究论文。虽然在我看来,论文比课程难啃得多,但它们包含了大量尚未被翻译成更易理解形式的前沿知识。我会把读论文的优先级排在课程和实践之后,但如果你有机会提升阅读论文的能力,我仍然强烈建议你这样做。(你也可以看看我以前讲过的一段关于如何读论文的视频。)上课和动手构建对我来说很有趣,读论文则更像是一种「磨练」,但从论文中偶尔闪现的洞见,真的令人愉悦。
祝你度过一个美好的寒假,新年快乐。除了学习和创造,也希望你能多花时间陪伴亲人 —— 那同样非常重要!
Love,
Andrew
2025年着实是精彩绝伦的一年。
作为每年的保留节目,吴恩达的年终总结都能带我们回顾全年最重要的人工智能事件和发展趋势。
2022年,是AI 的璀璨之年,生成文本、图像、视频、音乐和代码的系统即将到来,引发了关于创造力的未来问题的讨论。
2023年,是创新与焦虑的一年,生成式 AI 浪潮席卷了各行各业,其不断扩大的能力引发了智能机器可能会使人类过时的担忧。
2024年,是暴风雪般进步的一年,人工智能取得了突破性进展。智能代理系统提升了推理、使用工具和控制桌面应用程序的能力。小型模型迅速普及,其中许多比其前辈更强大且价格更低廉。
2025年,或将被铭记为 AI 工业时代的黎明。让我们跟随吴恩达的视角,探索2025年最具代表性的AI大事。

去年年末,OpenAI 推出了首个推理模型 o1,将一种具备代理能力的推理工作流内嵌其中。今年 1 月,DeepSeek-R1 向世界展示了如何构建这种能力。结果是:数学与编程性能立刻提升,问题回答更准确,机器人能力更强,AI 智能体取得快速进展。

在 2025 年初,模型只有在被明确提示时才会执行推理策略。如今,大多数新的大语言模型都会默认这样做,从而在广泛任务上显著提升了性能。
推理能力显著提升了 LLM 的性能,但更优输出也伴随着成本。Gemini 3 Flash 在开启推理时运行 Artificial Analysis 的 Intelligence Index 基准共消耗 1.6 亿 tokens(得分 71),而关闭推理仅消耗 740 万 tokens(得分明显更低,为 55)。此外,生成推理 tokens 会延迟输出,这也给 LLM 推理服务商带来了更大的性能压力。不过,研究人员正在努力提高效率。Claude Opus 4.5 与 GPT-5.1 在高推理设置下取得了相同的 Intelligence Index 分数,但前者消耗 4800 万 tokens,后者则消耗 8100 万 tokens。
领先的 AI 公司展开了一场激烈的人才争夺战,用堪比职业体育明星级别的薪酬,从竞争对手那里挖走顶尖人才。
7 月,Meta 发起大规模招聘,为新成立的 Meta Superintelligence Labs 组建团队,向来自 OpenAI、Google、Anthropic 等顶级 AI 公司的研究人员开出高达数亿美元的待遇。作为回应,Meta 的竞争对手反过来从 Meta 及彼此之间挖走关键员工,使 AI 人才的市场价值被推至前所未有的高度。

据《华尔街日报》报道,在成功招募 Alexandr Wang 及其核心团队成员之后,Meta 首席执行官 Mark Zuckerberg 列出了一份「心愿清单」。
随着 2026 年的到来,AI 招聘格局已发生巨大变化。据《华尔街日报》报道,为了抵御猎头挖角,OpenAI 提供了比竞争对手更高比例的股票型薪酬,加快了新员工期权的归属进度,并发放高达 150 万美元 的留任奖金。
尽管 2025 年出现了关于 AI 泡沫的讨论,但对于计划投入数百亿美元建设 AI 数据中心的公司来说,高薪是完全理性的选择:如果你愿意在硬件上花这么多钱,为什么不拿出其中一小部分用于支付人才薪酬呢?
头部 AI 公司纷纷宣布了庞大的建设计划,预计在未来几年内将豪掷数万亿美元,并消耗数吉瓦(GW)的电力。
仅今年一年,AI 行业的资本支出就突破了 3000 亿美元,其中大部分用于建设处理 AI 任务的新数据中心。这还仅仅是「前菜」,各大公司正在规划堪称宏伟的蓝图——建设规模堪比小镇、能耗相当于中型城市的设施。据麦肯锡预测,为了建设足够的算力以满足预期的推理和训练需求,这场竞赛的成本到 2030 年可能高达 5.2 万亿美元。

尽管存在对 AI 泡沫的担忧,但基础设施建设热潮正在为原本不温不火的经济带来实实在在的增长。哈佛大学经济学家 Jason Furman 指出,2025 年上半年美国GDP的增长几乎全部来自数据中心和 AI 领域的投资。在此阶段,有证据支持这样一种观点:2025 年拉开了新工业时代的序幕。
编程已成为智能体工作流中具有最直接商业价值的应用场景。Claude Code、Google Gemini CLI、OpenAI Codex 以及其他应用,将「编程智能体」变成了 AI 巨头之间竞争最激烈的战场之一。为了留在牌桌上,规模较小的竞争对手也纷纷开发了自己的智能体模型。
当 2024 年首个开创性的智能体代码生成器 Devin 问世时,它将 SWE-Bench 编程挑战基准测试的最高水平(SOTA)从 1.96% 提升到了 13.86%。到了 2025 年,使用最新大语言模型的编程智能体已能常态化地完成超过 80% 的同类任务。

智能体系统不断推高 SWE-Bench 这一热门编程基准测试的上限,促使研究人员寻找替代的方式来评估其性能。这些努力催生了 SWE-Bench Verified、SWE-Bench Pro、LiveBench、Terminal-Bench、𝜏-Bench 和 CodeClash 等新基准。
2025 年初,大多数观察家还认为智能体仅擅长生成常规代码、文档和单元测试,而在处理更高阶的战略性问题上,资深人类工程师和产品经理的表现依然更胜一筹。但到了年底,许多公司报告称已开始自动化资深级别的任务。Microsoft、Google、Amazon 和 Anthropic 均表示,他们自身越来越多的代码正由 AI 生成。
更多细节,请参阅年度总结原文。
回望 2025,我们似乎见证了一场关于「规模」的游戏。
在这一年,AI 终于脱离了单纯的算法竞赛,演变成一场涉及人才、算力、基建和能源的工业革命。从超大规模数据中心到能耗巨大的算力集群,科技巨头们正以前所未有的资源投入,加速实现通往 AGI 的技术跨越。
这种宏大的叙事往往让人感到渺小,甚至焦虑。当 AI 的进化速度以「天」为单位,当顶尖人才的薪酬变成天文数字,普通开发者和从业者的位置在哪里?吴恩达给出了答案。
虽然 2025 是 AI 变得最「重」的一年,但它也是 AI 开发变得最「轻」的一年。推理模型的成熟和编程智能体的进化,极大地拉低了创造的门槛。正如吴恩达所言,现在是软件开发前所未有的黄金时代。巨头们负责铺设电网和铁路(基础设施),而每一位开发者、学生、研究者,则拥有了在这些轨道上建造飞船的权利。
最好的预测未来的方式,就是去亲手构建它。
祝你在即将到来的 2026 年,保持好奇,永远不要停止学习。
新年快乐!
文章来自于微信公众号 “机器之心”,作者 “机器之心”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/