AI资讯新闻榜单内容搜索-SOTA

不靠Agent，4步修复真Bug！蚂蚁CGM登顶SWE-Bench开源榜

Agentless+开源模型，也能高质量完成仓库级代码修复任务，效果媲美业界 SOTA 。

来自主题: AI技术研报

10185 点击 2025-06-27 16:30

这款 Agent 擅长多轮搜索和推理，平均每项任务执行 23 个推理步骤，访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建，并完全通过端到端智能体强化学习进行训练，也是国内少有的基于自研模型打造的 Agent。

来自主题: AI资讯

9206 点击 2025-06-21 19:42

“边看边画，边画边想”，让大模型掌握空间思考能力，结果直接实现空间推理任务新SOTA。

来自主题: AI技术研报

7992 点击 2025-06-21 16:48

在信息爆炸的时代，推荐系统已成为我们获取资讯、商品和服务的核心入口。无论是电商平台的 “猜你喜欢”，还是内容应用的信息流，背后都离不开推荐算法的默默耕耘

来自主题: AI技术研报

7259 点击 2025-06-21 12:53

生成图像这件事，会推理的AI才是好AI。举个例子，以往要是给AI一句这样的Prompt：（3+6）条命的动物。我们人类肯定一眼就知道是猫咪，但AI的思考过程却是这样的：

来自主题: AI技术研报

8802 点击 2025-06-20 16:08

GUI智能体总是出错，甚至是不可逆的错误。即使是像GPT-4o这样的顶级多模态大模型，也会因为缺乏常识而在执行GUI任务时犯错。在它即将执行错误决策时，需要有人提醒它出错了。

来自主题: AI资讯

9921 点击 2025-06-17 16:59

深夜，沉寂已久的Kimi突然发布了新模型—— 开源代码模型Kimi-Dev，在SWE-bench Verified上以60.4%的成绩取得开源SOTA。

来自主题: AI资讯

10450 点击 2025-06-17 11:34

想象一下：你正在浏览社交媒体，看到一张震撼的图片或一段令人震撼的视频。它栩栩如生，细节丰富，让你不禁信以为真。但它究竟是真实记录，还是由顶尖 AI 精心炮制的「杰作」？如果一个 AI 工具告诉你这是「假的」，它能进一步解释理由吗？它能清晰指出图像中不合常理的光影，或是视频里一闪而过的时序破绽吗？

来自主题: AI技术研报

9007 点击 2025-06-15 12:39

昨天，谷歌DeepMind与谷歌研究团队正式推出交互式气象平台Weather Lab，用于共享人工智能天气模型。在热带气旋路径预测方面，谷歌这次的新模型刷新SOTA，是首个在性能上明确超越主流物理模型的AI预测模型。

来自主题: AI资讯

12279 点击 2025-06-13 15:24

想象一下，你是一位游戏设计师，正在为一个奇幻 RPG 游戏搭建场景。你需要创建一个 "精灵族树屋村落"—— 参天古木和树屋、发光的蘑菇路灯、半透明的纱幔帐篷... 传统工作流程中，这可能需要数周时间：先手工建模每个 3D 资产，再逐个调整位置和材质，最后反复测试光照效果…… 总之就是一个字，难。

来自主题: AI技术研报

9203 点击 2025-06-12 17:09