AI资讯新闻榜单内容搜索-模型训练

夸克、浙大开源OmniAvatar，一张图+一段音，就能生成长视频

近期，夸克技术团队和浙江大学联合开源了OmniAvatar，这是一个创新的音频驱动全身视频生成模型，只需要输入一张图片和一段音频，OmniAvatar即可生成相应视频，且显著提升了画面中人物的唇形同步细节和全身动作的流畅性。此外，还可通过提示词进一步精准控制人物姿势、情绪、场景等要素。

来自主题: AI资讯

6127 点击 2025-07-25 17:07

Agent KB：经验池让Agents互相学习！GAIA新开源SOTA，Pass@1性能最高提升6.66

近日，来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索，让智能体能够从其他任务的成功经验中学习，显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报

6492 点击 2025-07-25 16:50

仅凭「Prompt」，Gemini拿下IMO2025金牌 | 附提示词

就在昨天，来自UCLA的两位研究者黄溢辰和杨林做了一件让整个AI圈都震惊的事。他们用Google的Gemini 2.5 Pro模型，在2025年国际数学奥林匹克竞赛中拿下了金牌水平的成绩，6道题解对了5道。这可不是什么花架子，IMO被公认为是测试AI推理能力的终极试金石，因为它需要的不仅仅是计算，更需要创造性思维和严密的逻辑推理。

来自主题: AI资讯

5800 点击 2025-07-25 10:20

突破单token预测局限！南洋理工首次将多token预测引入微调，编程任务准确率提升11.67%

告别Next-token，现在模型微调阶段就能直接多token预测！

来自主题: AI技术研报

7287 点击 2025-07-25 10:00

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报

7372 点击 2025-07-25 09:51

五倍推理加速，激发自回归潜能，苹果新工作让LLM预测未来

近年来，语言模型的显著进展主要得益于大规模文本数据的可获得性以及自回归训练方法的有效性。

来自主题: AI技术研报

7046 点击 2025-07-24 15:28

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

大语言模型（Large Language Model, LLM）在复杂推理任务中表现卓越。借助链式思维（Chain-of-Thought, CoT），LLM 能够将复杂问题分解为简单步骤，充分探索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力，尤其是数学推理和代码生成。

来自主题: AI技术研报

4829 点击 2025-07-24 15:10

当AI学会欺骗，我们该如何应对？

前沿模型越来越多地被训练和部署为自主智能体。一个安全担忧是，AI智能体可能会隐秘地追求与人类目标不一致的目标，隐藏其真实能力和目的——这也被称为AI欺骗或谋划行为（AI deception or scheming）。

来自主题: AI资讯

8508 点击 2025-07-24 11:34

Nature：让AI自适应学习，需要先给它装个多巴胺系统吗？

持续适应性学习，即指适应环境并提升表现的能力，是自然智能与人工智能共有的关键特征。大脑达成这一目标的核心机制在于神经递质调控（例如多巴胺DA、乙酰胆碱ACh、肾上腺素）通过设置大脑全局变量来有效防止灾难性遗忘，这一机制有望增强人工神经网络在持续学习场景中的鲁棒性。本文将概述该领域的进展，进而详述两项6月Nature发表的背靠背相关研究。

来自主题: AI技术研报

4527 点击 2025-07-24 10:51

无线合成数据助力破解物理感知大模型数据瓶颈，SynCheck获顶会最佳论文奖

在万物互联的智能时代，具身智能和空间智能需要的不仅是视觉和语言，还需要突破传统感官限制的能力

来自主题: AI技术研报

7394 点击 2025-07-24 10:37