AI资讯新闻榜单内容搜索-大型语言模型

管你模型多大，250份有毒文档统统放倒，Anthropic：迄今为止规模最大的大模型数据投毒调查

本次新研究是迄今为止规模最大的大模型数据投毒调查。Anthropic 与英国人工智能安全研究所（UK AI Security Institute）和艾伦・图灵研究所（Alan Turing Institute）联合进行的一项研究彻底打破了这一传统观念：只需 250 份恶意文档就可能在大型语言模型中制造出「后门」漏洞，且这一结论与模型规模或训练数据量无关。

来自主题: AI技术研报

7347 点击 2025-10-10 12:14

想让LLM精确输出？试下XML格式Prompt语法约束解码GCD，帮你迭代收敛到稳定解

随着Agent的爆发，大型语言模型（LLM）的应用不再局限于生成日常对话，而是越来越多地被要求输出像JSON或XML这样的结构化数据。这种结构化输出对于确保安全性、与其他软件系统互操作以及执行下游自动化任务至关重要。

来自主题: AI技术研报

6093 点击 2025-09-16 10:19

不微调，让LLM推理准确率暴增到99%！试下DeepConf，一个轻量级推理框架｜Meta最新

在大型语言模型（LLM）进行数学题、逻辑推理等复杂任务时，一个非常流行且有效的方法叫做 “自洽性”（Self-Consistency），通常也被称为“平行思考”。

来自主题: AI技术研报

5363 点击 2025-09-09 10:17

Copilot强塞马斯克Grok新模型，遭开发者集体“抵抗”！GitHub内部工程师曝：我们是被“胁迫”的

近日，微软旗下的协作式编程平台 GitHub 正深化与埃隆·马斯克旗下 xAI 公司的合作，将 xAI 的 Grok Code Fast 1 大型语言模型（LLM）的早期使用权整合到 GitHub Copilot 中。

来自主题: AI资讯

7652 点击 2025-09-04 12:30

苹果新研究：不微调、不重训，如何让AI提问效率暴增6.5倍？

在这场以大型语言模型（LLM）为核心的 AI 浪潮中，苹果似乎一直保持着低调，很少出现在技术报道的前沿。尽管如此，时不时地，该公司也能拿出一些非常亮眼的研究成果，比如能在 iPhone 上直接运行的高效视觉语言模型 FastVLM。

来自主题: AI技术研报

7518 点击 2025-09-03 13:04

速递｜Reddit创始人押注840万！Palabra攻克AI语音翻译“拟真实时”难题

一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎，致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。

来自主题: AI资讯

6718 点击 2025-08-16 15:43

大型语言模型稳定强化学习的新路径：几何平均策略优化GMPO

近年来，强化学习（RL）在大型语言模型（LLM）的微调过程中，尤其是在推理能力提升方面，取得了显著的成效。传统的强化学习方法，如近端策略优化（Proximal Policy Optimization，PPO）及其变种，包括组相对策略优化（Group Relative Policy Optimization，GRPO），在处理复杂推理任务时表现出了强大的潜力。

来自主题: AI技术研报

5998 点击 2025-08-13 16:03