拜拜了SWE-Bench!Cursor刚发了个AI Coding评测基准,难哭Claude
拜拜了SWE-Bench!Cursor刚发了个AI Coding评测基准,难哭Claude编程智能体时代,顶流Cursor举旗发布新的评测基准——CursorBench,专门评价Cursor中不同模型谁更“智能体”(即高效执行复杂任务)。关于咋评的这个问题,Cursor还专门撰写了一篇博客。
编程智能体时代,顶流Cursor举旗发布新的评测基准——CursorBench,专门评价Cursor中不同模型谁更“智能体”(即高效执行复杂任务)。关于咋评的这个问题,Cursor还专门撰写了一篇博客。
联创前脚跑路,后脚马斯克就兴高采烈地迎来了新同事。两名Cursor大将,高调宣布加盟xAI——Andrew Milich:Cursor产品与工程负责人。Jason Ginsberg:Cursor工程负责人。
今日凌晨,Cursor宣布推出类OpenClaw功能——Cursor Automations,让AI 7×24小时自动帮开发者审核、监控、修复代码,还能辅助研发流程。基于这一功能,开发者只需配置Agent,让它们持续监控并优化代码库,就能打造出真正自动化的“软件研发工厂”。并且,所有的这些自动化能力都由云端Agent驱动,它们会使用自己的算力去构建、测试和演示工作成果。
2月12号,我发了一条用 AI 做的《怪奇物语》终局之战的视频。然后它爆了。仅黑叉平台一个渠道,92 条相关推文的总浏览量就达到了 1914 万。总点赞 52 万,转发 4.9 万,回复 5000+。
最近Cursor 发布了 Composer 1.5。这一版把强化学习规模扩大了 20 倍,后训练计算量甚至超过了基座模型的预训练投入。还加了 thinking tokens 和自我摘要机制,让模型能在复杂编程任务里做更深度的推理。
昨天刷到 Claude Code 更新日志的时候,看到一个新功能直接让我愣住了。
需要很多理性,但同时也需要很多感性。
为什么程序员早就有了 Cursor 这种能主动干活的神仙工具,而我们 Office 打工人还在被各种“辅助插件”折磨?
一个曾被Cursor官方盖章认定的全球前0.01%顶级玩家,却在Claude Code 2.0发布后果断「倒戈」!这不只是换工具,而是底层的游戏规则已经悄悄换了。
这是硅谷近期最大的黑色幽默:Cursor CEO亲拆自家招牌。当「Vibe Coding」变成一场盲目的狂欢,技术次贷危机的引信已被悄悄点燃。