AI资讯新闻榜单内容搜索-模型

SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？

近年来，链式推理和强化学习已经被广泛应用于大语言模型，让大语言模型的推理能力得到了显著提升。

来自主题: AI技术研报

7830 点击 2025-06-17 10:15

大模型“六小虎”人事动荡，半年12位高管离职

百川智能、零一万物、智谱核心高管出走，京东悄悄挖人。智东西6月16日报道，今年上半年，“大模型六小虎”中的智谱、MiniMax、零一万物、百川智能、阶跃星辰5家企业，共被曝13位AI高管变动，其中有12位出走、1位新入职

来自主题: AI资讯

10748 点击 2025-06-17 10:10

AI竟会看Prompt下菜！Vibe coding普通人vs程序员，剑桥最新报告

您有没有发现一个奇怪的现象：同样是Vibe coding，有些人轻松拿到完整的Flask应用，有些人却只得到几行if-else语句？剑桥大学计算机科学与技术系的研究者们最近发布了一项研究，用科学的方法证实了我们的直觉——AI确实会"看人下菜碟"。

来自主题: AI技术研报

9057 点击 2025-06-17 10:08

从"工具人"到"数字队友"：AI协作革命的最后一公里

从数字工具到数字队友的进化之路神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点介绍国外的新技术、新观点、新风向。

来自主题: AI资讯

9838 点击 2025-06-17 10:05

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

当前，Agentic RAG（Retrieval-Augmented Generation）正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中，搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面，部分方法优化的目标与真实下游需求存在偏离，另一方面，搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报

8972 点击 2025-06-17 09:46