不靠Agent,4步修复真Bug!蚂蚁CGM登顶SWE-Bench开源榜
不靠Agent,4步修复真Bug!蚂蚁CGM登顶SWE-Bench开源榜Agentless+开源模型,也能高质量完成仓库级代码修复任务,效果媲美业界 SOTA 。
Agentless+开源模型,也能高质量完成仓库级代码修复任务,效果媲美业界 SOTA 。
AI 搜索 Agent 产品 Genspark 近期被 Anthropic 官方点名了。「Less structure, more intelligence.」是 AI 搜索 Agent 产品 Genspark 一直以来坚持的基本原则。Genspark 团队认为,过度结构化的工作流程会限制创造力和深度,赋予专业 Agent 更多自主权,自由选择并灵活运用多种工具来处理问题,反而能释放出更强的能力。
这篇文章不只是关于 Coding Agent 的使用体验,也包括对相关关键技术,例如语言搜索、MCP 的探索和理解。Coding Agent 结合 MCP 是一种值得探索的新的自动化方式。
Nature never undertakes any change unless her interests are served by an increase in entropy. 自然界的任何变化,唯有在熵增符合其利益时方会发生——Max Planck
你有没有遇到过这样的算力困境:买了 GPU,用不了几次就闲置烧钱,偶尔想用的时候却一卡难求?
今天上午,小米发布了其首个开源推理大模型-Xiaomi MiMo。通过 25 T 预训练 + MTP 加速 + 规则化 RL + Seamless Rollout,让 7 B 参数的 MiMo-7B 在数理推理和代码生成上赶超 30 B-32 B 大模型,并完整 MIT 开源全系列与工程链,给端-云一体 AI 落地提供了“以小博大”的新范例。
less structure,more intelligence.
Ilya Sutskever(前 OpenAI 联合创始人兼首席科学家)在前几天召开的 NeurIPS 会议上表示,大模型的预训练已经走到了尽头。而 Noam Brown(OpenAI 研究员,曾带领团队开发出在德州扑克中战胜职业选手的 AI 系统 Pluribus)在近期关于 OpenAI O1 发布的采访中提到,提升 Test-Time Compute 是提升大模型答案质量的关键。
less is more,半步也是进步
Richard Sutton 在 「The Bitter Lesson」中做过这样的评价:「从70年的人工智能研究中可以得出的最重要教训是,那些利用计算的通用方法最终是最有效的,而且优势巨大。」