AI资讯新闻榜单内容搜索-LLM

性能提升11.74%！腾讯优图提出激励推理，专攻复杂指令

现有的语言大模型（LLMs）在复杂指令下的理解和执行能力仍需提升。

来自主题: AI技术研报

8883 点击 2025-06-24 10:10

大语言模型（LLM）能力提升引发对潜在风险的担忧，洞察其内部“思维过程”、识别危险信号成AI安全核心挑战。

来自主题: AI技术研报

9113 点击 2025-06-23 14:58

强化学习可以提升LLM推理吗？英伟达ProRL用超2000步训练配方给出了响亮的答案。仅15亿参数模型，媲美Deepseek-R1-7B，数学、代码等全面泛化。

来自主题: AI技术研报

8408 点击 2025-06-22 16:32

在 ChatGPT 等大语言模型（LLMs）席卷全球的今天，越来越多的研究者意识到：我们需要的不只是 “会说话” 的 LLM，更是 “能解释” 的 LLM。

来自主题: AI技术研报

9569 点击 2025-06-22 16:25

强化学习（RL）已经成为当今 LLM 不可或缺的技术之一。从大模型对齐到推理模型训练再到如今的智能体强化学习（Agentic RL），你几乎能在当今 AI 领域的每个领域看到强化学习的身影。

来自主题: AI技术研报

8808 点击 2025-06-22 16:08

在 AI 领域，英伟达开发的 CUDA 是驱动大语言模型（LLM）训练和推理的核心计算引擎。

来自主题: AI资讯

8807 点击 2025-06-22 12:07

大语言模型（LLMs）在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调（RLFT），通过自我生成的推理链（CoT）优化模型，提升决策能力。实验表明，RLFT可增加模型探索性，缩小知行差距，但探索策略仍有改进空间。

来自主题: AI技术研报

8218 点击 2025-06-22 11:34

在人工智能领域，大型语言模型（LLM）的推理能力正以前所未有的速度发展。

来自主题: AI资讯

7181 点击 2025-06-21 17:58

LLM 智能体的时代，单个 Agent 的能力已到瓶颈，组建像 “智能体天团” 一样的多智能体系统已经见证了广泛的成功

来自主题: AI技术研报

9064 点击 2025-06-21 17:05

人人都绕不开的推荐系统，如今正被注入新的 AI 动能。随着 AI 领域掀起一场由大型语言模型（LLM）引领的生成式革命，它们凭借着强大的端到端学习能力、海量数据理解能力以及前所未有的内容生成潜力，开始重塑各领域的传统技术栈。

来自主题: AI技术研报

10215 点击 2025-06-20 11:08