AI资讯新闻榜单内容搜索-框架

港大联手月之暗面等开源OpenCUA：人人可造专属电脑智能体

刚刚，一篇来自香港大学 XLANG Lab 和月之暗面等多家机构的论文上线了 arXiv，其中提出了一个用于构建和扩展 CUA（使用计算机的智能体）的完全开源的框架。使用该框架，他们还构建了一个旗舰模型 OpenCUA-32B，其在 OSWorld-Verified 上达到了 34.8% 的成功率，创下了新的开源 SOTA，甚至在这个基准测试中超越了 GPT-4o。

来自主题: AI技术研报

10513 点击 2025-08-14 09:39

具身智能体主动迎战对抗攻击，清华团队提出主动防御框架

面对对抗攻击，具身智能体除了被动防范，也能主动出击！在人类视觉系统启发下，清华朱军团队在TPMAI 2025中提出了强化学习驱动的主动防御框架REIN-EAD。

来自主题: AI技术研报

8630 点击 2025-08-13 11:21

超低标注需求，实现医学图像分割！UCSD提出三阶段框架GenSeg

GenSeg用AI生成高质量医学图像及对应分割标注，在仅有几十张样本时也能训练出媲美传统深度模型的分割系统，显著降低医生手工标注负担。

来自主题: AI技术研报

8036 点击 2025-08-10 15:05

独家｜陈天桥布局端到端Deep Research生态赛道，MiroMind发布全栈开源深度研究项目ODR

全栈开源生态系统：涵盖Agent框架（MiroFlow）、模型（MiroThinker）、数据（MiroVerse）和训练基础设施（MiroTrain / MiroRL）的全栈开源方案，所有组件和流程均开放共享，便于学习、复用与二次开发。

来自主题: AI资讯

9411 点击 2025-08-09 17:11

1句话高质量生成游戏3D动作，北大新方法刷新动画制作SOTA

北京大学提出了ReMoMask：一种全新的基于检索增强生成的Text-to-Motion框架。它是一个集成三项关键创新的统一框架：（1）基于动量的双向文本-动作模型，通过动量队列将负样本的尺度与批次大小解耦，显著提高了跨模态检索精度；（2）语义时空注意力机制，在部件级融合过程中强制执行生物力学约束，消除异步伪影；（3）RAG-无分类器引导结合轻微的无条件生成以增强泛化能力。

来自主题: AI技术研报

9899 点击 2025-08-09 11:32

无需外部数据！AI自问自答实现推理能力进化

AI通过自问自答就能提升推理能力？！这正是卡内基梅隆大学团队提出的新框架SQLM——一种无需外部数据的自我提问模型。

来自主题: AI资讯

7368 点击 2025-08-08 16:56

颠覆互联网的下一波浪潮：Agentic Web来了！

过去三十年，互联网经历了从静态网页到智能推荐的深刻演变。如今，我们正站在互联网的另一个重大转折点上。这一转折，来自一种全新的范式设想 —— Agentic Web，一个由 AI 智能体组成的、目标导向型的互联网系统。在这个新框架中，用户不再手动浏览网页、点击按钮，而是通过自然语言向智能体发出一个目标，AI 会自主规划、搜索、调用服务、协调其他智能体，最终完成复杂任务。

来自主题: AI技术研报

9147 点击 2025-08-08 12:03