AI资讯新闻榜单内容搜索-研究

SOTA大模型遇上加密数据评测：Qwen3未破10%，o1也栽了丨上海AI Lab等联合研究

大语言模型遇上加密数据，即使是最新Qwen3也直冒冷汗！

来自主题: AI技术研报

8680 点击 2025-05-29 14:59

成本暴降88%！通义实验室、北大发布ZeroSearch，无需搜索即可激活LLM检索能力

信息检索能力对提升大语言模型 (LLMs) 的推理表现至关重要，近期研究尝试引入强化学习 (RL) 框架激活 LLMs 主动搜集信息的能力，但现有方法在训练过程中面临两大核心挑战：

来自主题: AI技术研报

6611 点击 2025-05-29 14:48

爆火论文颠覆RL认知！「错误奖励」让LLM推理暴涨24.6%，学界惊了

来自华盛顿大学、AI2、UC伯克利研究团队证实，「伪奖励」（Spurious Rewards）也能带来LLM推理能力提升的惊喜。

来自主题: AI技术研报

8525 点击 2025-05-29 10:18

准确率92.7%逼近Claude 3.5、成本降低86%，开源代码定位新神器LocAgent来了

又是一个让程序员狂欢的研究！来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架，直接把代码定位准确率拉到了 92.7% 的新高度。该研究已被 ACL 2025 录用。

来自主题: AI技术研报

8084 点击 2025-05-29 10:03

小红书成立「hi lab」，提出要对AI做人文训练

第一财经「新皮层」独家获得消息称，小红书已将内部大模型技术与应用产品团队升级为「hi lab」（人文智能实验室，Humane Intelligence Lab）。同时，小红书今年年初开始组建「AI人文训练师」团队，邀请有深厚人文背景的研究者与AI领域的算法工程师、科学家共同完成对AI的后训练，以训练AI具有更好的人文素养以及表现上的一致性。而这个「AI人文训练师」团队也隶属于「hi lab」。

来自主题: AI资讯

9589 点击 2025-05-28 21:59