AI资讯新闻榜单内容搜索-GE

微软开源浏览器Agent，可实时跟踪、控制智能体，超4000颗星

微软在官网开源了一个专用于浏览器网络任务的Agent——Magentic-UI。Magentic-UI是基于微软曾经开源的 Magentic-One基础之上开发而成，并支持人机协同的控制方法来提升智能体的执行效率和准确率。

来自主题: AI资讯

10497 点击 2025-05-27 10:46

随着基础模型的快速发展和 AI Agent 进入规模化应用阶段，被广泛使用的基准测试（Benchmark）却面临一个日益尖锐的问题：想要真实地反映 AI 的客观能力正变得越来越困难。

来自主题: AI技术研报

9921 点击 2025-05-27 09:50

国产智能体，这次真封神了。

来自主题: AI资讯

10341 点击 2025-05-26 14:12

这个开源项目，Star 攀升趋势巨快。

来自主题: AI资讯

11926 点击 2025-05-26 10:30

1986年，图灵奖得主Fred Brooks在软件工程领域提出了著名的"没有银弹"理论：没有任何一种技术或方法能够独自带来软件工程生产力的数量级提升。近四十年后，这个深刻洞察在AI领域再次得到验证——你是否也曾经历过这样的挫折：

来自主题: AI技术研报

7434 点击 2025-05-26 09:50

自 Anthropic 推出 Claude Computer Use，打响电脑智能体（Computer Use Agent）的第一枪后，OpenAI 也相继推出 Operator，用强化学习（RL）算法把电脑智能体的能力推向新高，引发全球范围广泛关注。

来自主题: AI技术研报

9545 点击 2025-05-25 15:11

MedGemma是谷歌 “健康人工智能开发者基础”（Health AI Developer Foundations）计划的核心项目。基于 Gemma 3 架构， MedGemma提供多模态和纯文本两种模型变体，旨在降低医疗 AI 开发门槛。

来自主题: AI资讯

11658 点击 2025-05-24 22:46

年仅19岁少年，自称破解了谷歌最快的语言模型Gemini Diffusion，引爆社交平台。真相扑朔迷离，但有一点毫无疑问：谷歌I/O大会的「黑马」，比GPT快10倍的速度、媲美人类程序员的代码能力，正在掀起一场NLP范式大洗牌。

来自主题: AI资讯

9853 点击 2025-05-24 19:28

搅起波澜的 flowith 是个目前只有 10 人的年轻团队。生于 1996 年的创始人 Derek（倪正民）已是团队里最年长的；另外一位创始人 Zion（吴熠宸）生于 1998 年；最年轻的成员则是 00 后。

来自主题: AI资讯

13012 点击 2025-05-24 17:48

惊艳全球的Claude 4，但它到底是如何思考？来自Anthropic两位研究员最新一期博客采访，透露了很多细节。这两天大家可以说是试玩了不少，有人仅用一个提示就搞定了个浏览器Agent，包括API和前端……直接一整个大震惊，与此同时关于Claude 4可能有意识并试图干坏事的事情同样被爆出。

来自主题: AI资讯

10651 点击 2025-05-24 17:43