AI资讯新闻榜单内容搜索-模型训练

仅凭「Prompt」，Gemini拿下IMO2025金牌 | 附提示词

就在昨天，来自UCLA的两位研究者黄溢辰和杨林做了一件让整个AI圈都震惊的事。他们用Google的Gemini 2.5 Pro模型，在2025年国际数学奥林匹克竞赛中拿下了金牌水平的成绩，6道题解对了5道。这可不是什么花架子，IMO被公认为是测试AI推理能力的终极试金石，因为它需要的不仅仅是计算，更需要创造性思维和严密的逻辑推理。

来自主题: AI资讯

8480 点击 2025-07-25 10:20

突破单token预测局限！南洋理工首次将多token预测引入微调，编程任务准确率提升11.67%

告别Next-token，现在模型微调阶段就能直接多token预测！

来自主题: AI技术研报

9207 点击 2025-07-25 10:00

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报

9251 点击 2025-07-25 09:51

五倍推理加速，激发自回归潜能，苹果新工作让LLM预测未来

近年来，语言模型的显著进展主要得益于大规模文本数据的可获得性以及自回归训练方法的有效性。

来自主题: AI技术研报

8378 点击 2025-07-24 15:28

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

大语言模型（Large Language Model, LLM）在复杂推理任务中表现卓越。借助链式思维（Chain-of-Thought, CoT），LLM 能够将复杂问题分解为简单步骤，充分探索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力，尤其是数学推理和代码生成。

来自主题: AI技术研报

6844 点击 2025-07-24 15:10

当AI学会欺骗，我们该如何应对？

前沿模型越来越多地被训练和部署为自主智能体。一个安全担忧是，AI智能体可能会隐秘地追求与人类目标不一致的目标，隐藏其真实能力和目的——这也被称为AI欺骗或谋划行为（AI deception or scheming）。

来自主题: AI资讯

11118 点击 2025-07-24 11:34

Nature：让AI自适应学习，需要先给它装个多巴胺系统吗？

持续适应性学习，即指适应环境并提升表现的能力，是自然智能与人工智能共有的关键特征。大脑达成这一目标的核心机制在于神经递质调控（例如多巴胺DA、乙酰胆碱ACh、肾上腺素）通过设置大脑全局变量来有效防止灾难性遗忘，这一机制有望增强人工神经网络在持续学习场景中的鲁棒性。本文将概述该领域的进展，进而详述两项6月Nature发表的背靠背相关研究。

来自主题: AI技术研报

6526 点击 2025-07-24 10:51

无线合成数据助力破解物理感知大模型数据瓶颈，SynCheck获顶会最佳论文奖

在万物互联的智能时代，具身智能和空间智能需要的不仅是视觉和语言，还需要突破传统感官限制的能力

来自主题: AI技术研报

9590 点击 2025-07-24 10:37

官方揭秘ChatGPT Agent背后原理！通过强化学习让模型自主探索最佳工具组合

在正式走近ChatGPT Agent之前，让我们介绍一下这次谈话的几位主角，他们分别是OpenAI团队核心成员Isa Fulford、Casey Chu和孙之清。我们团队分别开发了Operator和Deep Research，在分析用户请求时发现，Deep Research的用户非常希望模型能够访问需要付费订阅的内容或有门槛的资源，而Operator恰好具备这种能力。

来自主题: AI资讯

9745 点击 2025-07-24 09:50

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

扩散语言模型（Diffusion-based LLMs，简称 dLLMs）以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性，成为一个重要的发展方向。

来自主题: AI技术研报

9728 点击 2025-07-23 15:04