拜拜了SWE-Bench!Cursor刚发了个AI Coding评测基准,难哭Claude
拜拜了SWE-Bench!Cursor刚发了个AI Coding评测基准,难哭Claude编程智能体时代,顶流Cursor举旗发布新的评测基准——CursorBench,专门评价Cursor中不同模型谁更“智能体”(即高效执行复杂任务)。关于咋评的这个问题,Cursor还专门撰写了一篇博客。
编程智能体时代,顶流Cursor举旗发布新的评测基准——CursorBench,专门评价Cursor中不同模型谁更“智能体”(即高效执行复杂任务)。关于咋评的这个问题,Cursor还专门撰写了一篇博客。
最近,一家医疗AI公司给出了更「系统级」的解法。刚刚,智诊科技(WiseDiag)正式发布企业级医疗健康行业智能体平台WiseClaw!它的产品底座,正是来自OpenClaw架构。
数学家陶哲轩,公开了AI新身份——SAIR Foundation联合创始人。之前,他是举世闻名的数学天才,年少成名的传奇数学家、13岁加冕IMO的最年轻金牌得主……24岁就成为加州大学洛杉矶分校(UCLA)史上最年轻的终身正教授。
一些 AI agent 已经开始自己注册邮箱服务了——它们通过网络搜索找到 AgentMail 这家公司,自己浏览网站,然后创建属于自己的邮箱,整个过程完全没有人类参与。
3月12日(周四),《纽约时报》发布了最新进展:“牛油果”(Avocado)模型确定再次推迟发布。据知情人士透露,Meta 继续开发数月的全新“前沿级”AI 模型,在推理、编程和写作的内部测试中,表现不及 Google、OpenAI 和 Anthropic 等竞争对手的领先模型。
如今打开 ClawHub 榜单,格局已经悄然改变:搜索类 Skill 中,百度的搜索工具下载及收藏量稳居前列,已经成为全球下载量第一的搜索引擎官方技能插件。对于国人来说,这个百度官方出品的中文搜索 Skill 更懂中文权威信息,同时也具备信息安全背书,可以说是搜索工具上的首选。
用这篇文章把现在市面上不同的龙虾产品统统讲清楚,看看哪个最合你的口味。同时,我们还会手把手教你在本地,安全地部署一只原汁原味的龙虾。
Reducto 在去年 6 个月内接连完成分别由 Benchmark 与 a16z 领投的两轮融资,估值翻了 3 倍,达到 6 亿美元。我们认为,Reducto 切中了 AI 应用走向生产环境过程中的“精确数据摄取”瓶颈。
据 2025 年的一份财务文件显示,英伟达将在未来五年内投入 260 亿美元用于构建开源人工智能模型。据《WIRED》杂志报道,英伟达高管证实了这一此前从未被报道过的消息。
AI 算力尽头在太空?当地面面临缺电与散热焦虑,中国力量硬核破局:首个「太空超算 + 钙钛矿能源」系统联调成功!两位 95 后创始人直面马斯克的星际算力野心,率先打通天基 AI 算力链条,抢占下一代计算制高点!