AI资讯新闻榜单内容搜索-LLM

开源在压榨GPU性价比！Linux 基金会掌门人揭露AI时代新技术栈：PARK！LLM 已经开始泡沫化，AI其实还没真正改变世界

在本周一举行的 Open Source Summit Japan 主题演讲中，Linux 基金会执行董事 Jim Zemlin 抛出了一个耐人寻味的判断： “AI 可能还谈不上全面泡沫化，但大模型或许已经开始泡沫化了。”

来自主题: AI资讯

11287 点击 2025-12-09 15:08

别被AI降智：Karpathy警示，把LLM当实体是对AGI最大的误读

引言：全网热议背后的本体论修正

来自主题: AI资讯

10194 点击 2025-12-09 14:39

全图与切片并非等价？LLaVA-UHD-v3揭示差异推出高效全图建模方案

随着多模态大模型（MLLMs）在各类视觉语言任务中展现出强大的理解与交互能力，如何高效地处理原生高分辨率图像以捕捉精细的视觉信息，已成为提升模型性能的关键方向。

来自主题: AI技术研报

10460 点击 2025-12-09 14:38

LLM强化学习不稳定之谜，被Qwen团队从「一阶近似」视角解开

如今，强化学习（RL）已成为提升大语言模型（LLM）复杂推理与解题能力的关键技术范式，而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性，LLM 的 RL 通常依赖序列级奖励 —— 即根据完整生成序列给一个标量分数。

来自主题: AI技术研报

6390 点击 2025-12-08 10:27

基于文本AI的终结？Agent协作可直接「复制思维」，Token效率暴涨

一直以来，传统 MAS 依赖自然语言沟通，各个 LLM 之间用文本交流思路。这种方法虽然可解释，但冗长、低效、信息易丢失。LatentMAS 则让智能体直接交换内部的隐藏层表示与 KV-cache 工作记忆，做到了：

来自主题: AI技术研报

8003 点击 2025-12-06 11:08

北航领衔发布300页代码智能综述：从基础模型到智能体，一次读懂Code LLM全景图

这篇学术论长文由北京航空航天大学复杂关键软件环境全国重点实验室领衔。《From Code Foundation Models to Agents and Applications》一文是对过去几年代码智能领域的一次系统梳理：模型、任务、训练、智能体、安全与应用都被串联成了一条完整、连贯的技术链路。

来自主题: AI技术研报

9412 点击 2025-12-06 10:54

Code LLM全景综述，从LLM到Agent，全文长303页，北航阿里字节等12家机构联合撰写｜最新

这篇论文由北京航空航天大学、阿里巴巴、字节跳动、上海人工智能实验室等几十家顶尖机构联合撰写，全文长达303页，是对当前“代码大模型（Code LLMs）”领域最详尽的百科全书式指南。

来自主题: AI技术研报

12264 点击 2025-12-05 09:24

斯坦福用一句Prompt就结束了提示工程。。。

最近口述采样很火。如果您经常使用经过“对齐”训练（如RLHF）的LLM，您可能已经注意到一个现象：模型虽然变得听话、安全了，但也变得巨“无聊”。

来自主题: AI技术研报

6990 点击 2025-12-04 10:25

从 LLM 到 World Model：为什么我们需要能理解并操作世界的空间智能？

如今 LLM 的语言理解与生成能力已展现出惊人的广泛适用性，但随着 LLM 的发展，一个事实越发凸显：仅靠语言，仍不足以支撑真正的智能。

来自主题: AI技术研报

11131 点击 2025-12-04 09:57

迎接「万物皆可RAG」时代：最新综述展示50多种多模态组合的巨大待探索空间

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增强生成（RAG）来产生用户问题的答案。随着多模态大模型（MLLMs）的崛起，大模型的主流技术之一 RAG 迅速向多模态发展，形成多模态检索增强生成（MM-RAG）这个新兴领域。ChatGPT、千问、豆包、Gemini 都开始允许用户提供文字、图片等多种模态的输入。

来自主题: AI技术研报

7574 点击 2025-12-03 09:54