AI资讯新闻榜单内容搜索-SOTA

刷榜风波惊动OpenAI后，百度伐谋（Famou）拿回Agent硬核榜单第一

近日，在由 OpenAI 主导设立的权威基准测试 MLE-Bench 上，企业级算法自主优化智能体百度伐谋（Famou）击败了各路玩家登顶，并刷新了 SOTA 成绩。

来自主题: AI资讯

11115 点击 2026-04-11 14:24

清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质

在人工智能研究中，许多研究者将大量时间投入到为那 1% 的性能提升反复调参与实验迭代之中。

来自主题: AI技术研报

7170 点击 2026-04-09 14:46

最强大脑组合！全球SOTA的逻辑和记忆CodeBrain-1&MemBrain1.5同时开源

刚刚，世界模型初创公司 Feeling AI 正式发布并开源 MemBrain1.5 和 CodeBrain-1。这两项在全球 Agentic 领域的顶尖工作同时开源，将正式终结 AI “无状态” 的工具时代，为世界模型植入具备自主逻辑与层级化记忆的 “原生大脑”，开启人机深度协同的交互新范式。

来自主题: AI资讯

8579 点击 2026-04-08 17:32

让大模型多模态检索全面超越SOTA！ReCALL框架化解生成式与判别式的范式冲突｜CVPR'26

生成式模型当检索器大材小用效果还不好？

来自主题: AI技术研报

9802 点击 2026-04-07 10:29

2700GB高质量数据，训出空间智能SOTA，背后秘诀全栈开源

什么在限制空间智能落地？

来自主题: AI技术研报

7468 点击 2026-03-31 14:39

ICLR 2026 | 让多模态模型学会主动说话：主动交互从训练到评估的完整方案

本文综合北京大学王选计算机研究所发布的 ProactiveVideoQA 和 MMDuet2 两篇论文，介绍视频多模态大模型如何实现 “主动交互”—— 在视频播放过程中自主决定何时发起回复，而非等待用户提问。ProactiveVideoQA 提出评估指标和 benchmark，MMDuet2 则通过强化学习训练方法实现了 SOTA 性能，无需精确的回复时间标注即可训练出及时、准确的主动交互模型。

来自主题: AI技术研报

9335 点击 2026-03-30 15:02