清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质
5798点击    2026-04-09 14:46

在人工智能研究中,许多研究者将大量时间投入到为那 1% 的性能提升反复调参与实验迭代之中。


一个越来越值得重视的问题是:人类科学家最宝贵的直觉与创造力,是否正被困在无止境的「增量式优化」中?


SOTA(State-of-the-Art,当前最佳水平的 AI 模型)长期被视为衡量研究价值的「金标准」。


当一篇学术论文刷新 SOTA 时,人们看到的,往往只是结果的跃升。但在结果背后,真正支撑起一次次「当前最佳」的,往往不是某一个瞬间的灵感,而是此后持续数月甚至数年的高强度实验迭代、参数调整与工程优化。


以 Transformer 架构的发展为例。自 2017 年问世以来,全球科研人员围绕这一架构投入了大量人力与算力,不断提出新变体、设计新模块、优化训练策略,才最终将其在通用语言理解评测集 GLUE 上的性能从约 75% 提升到 90% 以上。


清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质

Transformer 架构在 GLUE 评测集上的性能爬升


问题在于,这些优化工作虽然重要,却并不总是最值得由人类科学家重点投入的那一部分。


如果最优秀的科研人才被长期绑定在重复性的性能优化中,那么那些更具原创性、更需要长期思考的问题,谁来持续投入?


AutoSOTA 让 AI 科研自动化走向端到端闭环


正是在这样的背景下,在近期召开的中关村论坛上,清华大学与北京中关村学院联合发布研究成果 ——AutoSOTA


目前,AutoSOTA项目已发布预印本论文。


清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质


论文地址:https://arxiv.org/abs/2604.05550


AutoSOTA 面向端到端的 AI 科研自动化,致力于通过科研智能体加速高强度、重复性的实验迭代与优化过程,将研究者从持续的性能打磨中解放出来。


清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质

AutoSOTA 研究问题框架


不同于现有的代码优化框架,AutoSOTA 并不是对单一实验环节的局部加速。它将 AI 智能体的赋能边界进一步延伸到实验准备、实验执行等底层繁琐任务,以及研究思路生成等顶层构思环节,旨在实现从已有 SOTA 到新 SOTA、从现有代码仓库到新代码仓库的端到端 AI 科研自动化


清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质

AutoSOTA 端到端 AI 科研自动化系统


AutoSOTA 采用多智能体协作框架,借鉴人类算法研究中的分工流程与协作逻辑,使不同科研智能体能够围绕同一目标开展协同设计、实验执行、结果分析与方案迭代。


与此同时,AutoSOTA 配备了完善的工具库(Toolkit)与技能集(Skill Set),不仅能够处理实验运行中的复杂状况,还能够完成文献调研、思路生成、方案设计等高层次任务,从而在顶层规划与底层执行之间形成闭环。


这意味着,AutoSOTA 所追求的并不只是「把实验跑得更快」,而是真正推动 AI 科研自动化从单点辅助走向系统化、持续化、智能化的科研协作过程。


一周时间,发现 105 个性能显著提升的 SOTA 模型


在为期一周的实验中,AutoSOTA 以前一年 AI 顶会论文中的优秀成果为基础,自动发现了 105 个性能显著提升的模型方案。其中,超过 60% 的模型具有新颖的结构设计,平均性能提升接近 10%。


清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质

基于AutoSOTA的大规模SOTA AI模型发现


项目地址:https://tsinghua-fib-lab.github.io/AutoSOTA/


这组结果的意义在于,AutoSOTA 并非只是沿着既有路径进行简单搜索,也不局限于参数组合层面的穷举式优化。它在优化性能的同时,展现出一定程度的结构创新能力,能够在已有研究基础上继续挖掘新的设计空间,发现兼具性能提升与结构新颖性的模型方案。


AutoSOTA 的意义,不止于「再提几分」


AutoSOTA 的意义,不仅在于获得了一批新的 SOTA 结果,更在于它启发人类科学家重新审视科研创新的本质:SOTA 性能的刷新,是否等同于重要的科学突破?


AutoSOTA 启示我们进一步思考:如何将人类科学家最宝贵的注意力,从重复性的实验迭代中重新释放出来,回归到更具原创性、也更需要长期判断与创造力的研究问题上?


一种可能的人智协作模式是:由科研智能体系统承担大量重复性、密集型、长周期的优化过程,由人类科学家聚焦于提出问题、定义方向、识别机会与构想机制。在这一意义上,AutoSOTA 更像是一种面向科研流程的「创造力放大器」。


它并不是要替代科学家的原创性,而是要把原创性从低效、重复的实验劳动中解放出来。


清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质

AutoSOTA启发的人智协同科研范式


真正重要的,不是让研究者永远停留在「把已有模型再推高一点」的循环里,而是让他们有更多机会去面对那些尚未被定义、尚未被解释、也尚未被系统探索的问题。


AutoSOTA 正在朝这一方向迈出关键一步。它不仅展示了科研智能体在 AI 研究自动化中的巨大潜力,也让我们看到,当「性能优化」这项沉重工作逐步被智能体接管之后,科学研究有机会真正回到它最珍贵的起点 ——提出大胆的问题,探索未知的方向,追求不可替代的原创性突破


项目网站:https://tsinghua-fib-lab.github.io/AutoSOTA/


文章来自于"机器之心",作者 "机器之心"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md