AI资讯新闻榜单内容搜索-语言模型

人机协同筛出2600万条数据，七项基准全部SOTA，昆仑万维开源奖励模型再迎新突破

大语言模型（LLM）以生成能力强而著称，但如何能让它「听话」，是一门很深的学问。基于人类反馈的强化学习（RLHF）就是用来解决这个问题的，其中的奖励模型（Reward Model, RM）扮演着重要的裁判作用，它专门负责给 LLM 生成的内容打分，告诉模型什么是好，什么是不好，可以保证大模型的「三观」正确。

来自主题: AI技术研报

9166 点击 2025-07-05 12:10

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

多模态对齐模型借助对比学习在检索与生成任务中大放异彩。最新趋势是用冻结的大语言模型替换自训文本编码器，从而在长文本与大数据场景中降低算力成本。LIFT首次系统性地剖析了此范式的优势来源、数据适配性、以及关键设计选择，在组合语义理解与长文本任务上观察到大幅提升。

来自主题: AI技术研报

8324 点击 2025-07-03 11:00

AI Agent、传统聊天机器人有何区别？如何评测？这篇30页综述讲明白了

自从 Transformer 问世，NLP 领域发生了颠覆性变化。大语言模型极大提升了文本理解与生成能力，成为现代 AI 系统的基础。而今，AI 正不断向前，具备自主决策和复杂交互能力的新一代 AI Agent 也正加速崛起。

来自主题: AI技术研报

6752 点击 2025-07-03 10:31

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

将大语言模型（LLMs）与复杂的人类价值观对齐，仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习（RLHF）。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分，最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

来自主题: AI技术研报

10091 点击 2025-07-03 10:00

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

如果一个视觉语言模型（VLM）只会“看”，那真的是已经不够看的了。

来自主题: AI技术研报

10585 点击 2025-07-02 15:56

策略改写「一战历史」！中科院开源全新博弈智能体框架DipLLM

中科院自动化所提出DipLLM，这是首个在复杂策略游戏Diplomacy中基于大语言模型微调的智能体框架，仅用Cicero 1.5%的训练数据就实现超越

来自主题: AI资讯

9341 点击 2025-07-01 15:30

只用2700万参数，这个推理模型超越了DeepSeek和Claude

像人一样推理。大模型的架构，到了需要变革的时候？在对复杂任务的推理工作上，当前的大语言模型（LLM）主要采用思维链（CoT）技术，但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。

来自主题: AI技术研报

8205 点击 2025-07-01 10:26

疯狂挖人之后，小扎刚刚官宣超级智能 AI 梦之队，华人占大半 | 附 11 人核心名单

在长达数周的高强度「挖角」之后，Meta 今天凌晨宣布正式成立超级智能实验室（Meta Superintelligence Labs，简称 MSL）。Meta CEO 马克·扎克伯格在当时时间周一发布的一封内部信中透露，MSL 将整合公司现有的基础 AI 研究（FAIR）、大语言模型开发以及 AI 产品团队，并组建一个专门研发下一代 AI 模型的新实验室。

来自主题: AI资讯

10268 点击 2025-07-01 09:04

微软推出深度视频探索智能体，登顶多个长视频理解基准

尽管大型语言模型（LLMs）和大型视觉 - 语言模型（VLMs）在视频分析和长语境处理方面取得了显著进展，但它们在处理信息密集的数小时长视频时仍显示出局限性。

来自主题: AI技术研报

8234 点击 2025-06-30 14:34

打破长视频理解瓶颈：HoPE混合位置编码提升VLM长度泛化能力

如今的视觉语言模型 (VLM, Vision Language Models) 已经在视觉问答、图像描述等多模态任务上取得了卓越的表现。然而，它们在长视频理解和检索等长上下文任务中仍表现不佳。

来自主题: AI技术研报

8004 点击 2025-06-30 10:24