清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质

6829点击 2026-04-09 14:46

在人工智能研究中，许多研究者将大量时间投入到为那 1% 的性能提升反复调参与实验迭代之中。

一个越来越值得重视的问题是：人类科学家最宝贵的直觉与创造力，是否正被困在无止境的「增量式优化」中？

SOTA（State-of-the-Art，当前最佳水平的 AI 模型）长期被视为衡量研究价值的「金标准」。

当一篇学术论文刷新 SOTA 时，人们看到的，往往只是结果的跃升。但在结果背后，真正支撑起一次次「当前最佳」的，往往不是某一个瞬间的灵感，而是此后持续数月甚至数年的高强度实验迭代、参数调整与工程优化。

以 Transformer 架构的发展为例。自 2017 年问世以来，全球科研人员围绕这一架构投入了大量人力与算力，不断提出新变体、设计新模块、优化训练策略，才最终将其在通用语言理解评测集 GLUE 上的性能从约 75% 提升到 90% 以上。

清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质

Transformer 架构在 GLUE 评测集上的性能爬升

问题在于，这些优化工作虽然重要，却并不总是最值得由人类科学家重点投入的那一部分。

如果最优秀的科研人才被长期绑定在重复性的性能优化中，那么那些更具原创性、更需要长期思考的问题，谁来持续投入？

AutoSOTA 让 AI 科研自动化走向端到端闭环

正是在这样的背景下，在近期召开的中关村论坛上，清华大学与北京中关村学院联合发布研究成果 ——AutoSOTA。

目前，AutoSOTA项目已发布预印本论文。

清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质

论文地址：https://arxiv.org/abs/2604.05550

AutoSOTA 面向端到端的 AI 科研自动化，致力于通过科研智能体加速高强度、重复性的实验迭代与优化过程，将研究者从持续的性能打磨中解放出来。

清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质

AutoSOTA 研究问题框架

不同于现有的代码优化框架，AutoSOTA 并不是对单一实验环节的局部加速。它将 AI 智能体的赋能边界进一步延伸到实验准备、实验执行等底层繁琐任务，以及研究思路生成等顶层构思环节，旨在实现从已有 SOTA 到新 SOTA、从现有代码仓库到新代码仓库的端到端 AI 科研自动化。

清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质

AutoSOTA 端到端 AI 科研自动化系统

AutoSOTA 采用多智能体协作框架，借鉴人类算法研究中的分工流程与协作逻辑，使不同科研智能体能够围绕同一目标开展协同设计、实验执行、结果分析与方案迭代。

与此同时，AutoSOTA 配备了完善的工具库（Toolkit）与技能集（Skill Set），不仅能够处理实验运行中的复杂状况，还能够完成文献调研、思路生成、方案设计等高层次任务，从而在顶层规划与底层执行之间形成闭环。

这意味着，AutoSOTA 所追求的并不只是「把实验跑得更快」，而是真正推动 AI 科研自动化从单点辅助走向系统化、持续化、智能化的科研协作过程。

一周时间，发现 105 个性能显著提升的 SOTA 模型

在为期一周的实验中，AutoSOTA 以前一年 AI 顶会论文中的优秀成果为基础，自动发现了 105 个性能显著提升的模型方案。其中，超过 60% 的模型具有新颖的结构设计，平均性能提升接近 10%。

清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质

基于AutoSOTA的大规模SOTA AI模型发现

项目地址：https://tsinghua-fib-lab.github.io/AutoSOTA/

这组结果的意义在于，AutoSOTA 并非只是沿着既有路径进行简单搜索，也不局限于参数组合层面的穷举式优化。它在优化性能的同时，展现出一定程度的结构创新能力，能够在已有研究基础上继续挖掘新的设计空间，发现兼具性能提升与结构新颖性的模型方案。

AutoSOTA 的意义，不止于「再提几分」

AutoSOTA 的意义，不仅在于获得了一批新的 SOTA 结果，更在于它启发人类科学家重新审视科研创新的本质：SOTA 性能的刷新，是否等同于重要的科学突破？

AutoSOTA 启示我们进一步思考：如何将人类科学家最宝贵的注意力，从重复性的实验迭代中重新释放出来，回归到更具原创性、也更需要长期判断与创造力的研究问题上？

一种可能的人智协作模式是：由科研智能体系统承担大量重复性、密集型、长周期的优化过程，由人类科学家聚焦于提出问题、定义方向、识别机会与构想机制。在这一意义上，AutoSOTA 更像是一种面向科研流程的「创造力放大器」。

它并不是要替代科学家的原创性，而是要把原创性从低效、重复的实验劳动中解放出来。

清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质

AutoSOTA启发的人智协同科研范式

真正重要的，不是让研究者永远停留在「把已有模型再推高一点」的循环里，而是让他们有更多机会去面对那些尚未被定义、尚未被解释、也尚未被系统探索的问题。

AutoSOTA 正在朝这一方向迈出关键一步。它不仅展示了科研智能体在 AI 研究自动化中的巨大潜力，也让我们看到，当「性能优化」这项沉重工作逐步被智能体接管之后，科学研究有机会真正回到它最珍贵的起点 ——提出大胆的问题，探索未知的方向，追求不可替代的原创性突破。

项目网站：https://tsinghua-fib-lab.github.io/AutoSOTA/

文章来自于"机器之心"，作者 "机器之心"。

关键词: AI新闻 , AutoSOTA , Ai科研 , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md