AI资讯新闻榜单内容搜索-不

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制：仅5%注意力头负责多模态视觉理解

多模态大模型通常是在大型预训练语言模型（LLM）的基础上扩展而来。尽管原始的 LLM 并不具备视觉理解能力，但经过多模态训练后，这些模型却能在各类视觉相关任务中展现出强大的表现。

来自主题: AI技术研报

8318 点击 2025-07-15 10:07

完全免费开放，美图上线AI视觉Agent

本来以为美图可能会在 8 月份推出新产品，给中期财报壮声势，但没想到，公告发布 20 天不到，这款名为 RoboNeo 的 AI Agent 就上线了，而且是直接面向所有用户免费开放。

来自主题: AI资讯

11034 点击 2025-07-14 22:16

10项评测痛打GPT-4o！智源重磅开源全球最强具身智能大脑

最强具身大脑，宝座易主！在10项评测中，国产RoboBrain 2.0全面超越GPT-4o。这次，智源研究院开源了具身大脑RoboBrain 2.0 32B版本以及跨本体大小脑协同框架RoboOS 2.0单机版。不仅问鼎评测基准SOTA，还成功刷新跨本体多机协作技术范式！

来自主题: AI技术研报

9887 点击 2025-07-14 16:12

ACL 2025｜自我怀疑还是自我纠正？清华团队揭示LLMs反思技术的暗面

反思技术因其简单性和有效性受到了广泛的研究和应用，具体表现为在大语言模型遇到障碍或困难时，提示其“再想一下”，可以显著提升性能 [1]。然而，2024 年谷歌 DeepMind 的研究人员在一项研究中指出，大模型其实分不清对与错，如果不是仅仅提示模型反思那些它回答错误的问题，这样的提示策略反而可能让模型更倾向于把回答正确的答案改错 [2]。

来自主题: AI技术研报

8302 点击 2025-07-14 15:40