AI资讯新闻榜单内容搜索-模型训练

何恺明团队新作GeoPT，全新预训练范式用合成动力学让模型自学真实物理规律

GeoPT提出了一种全新的动力学提升预训练范式，通过合成动力学（Synthetic Dynamics）将静态几何“提升”到动态空间，让模型在无标签数据上通过学习粒子轨迹演化来获取物理直觉。

来自主题: AI技术研报

8731 点击 2026-02-28 14:58

DeepSeek新论文来了！联手清华、北大，优化智能体大模型推理

「DeepSeek V4 来了！」这样的消息是不是已经听烦了？总结来说，这篇新论文介绍了一个名为「DualPath」的创新推理系统，专门针对智能体工作负载下的大语言模型（LLM）推理性能进行优化。具体来讲，通过引入「双路径 KV-Cache 加载」机制，解决了在预填充 - 解码（PD）分离架构下，KV-Cache 读取负载不平衡的问题。

来自主题: AI技术研报

8383 点击 2026-02-27 11:35

算力救不了AI智商？谷歌新大招终结「随机鹦鹉」争论！

传统AI模型在稀疏奖励环境中，往往会找不到激励难以学会层次化思考。如今，谷歌团队通过引入元控制器操控模型内部残差流，让智能体学会了「跳跃式思考」。该研究揭示了大模型内部可自发形成了类似人脑的层次化决策机制，为AI在需要多步的复杂任务提供了全新的训练范式。

来自主题: AI技术研报

7820 点击 2026-02-27 10:58

小模型+Agent Skills能用吗？这份基于POMDP的工业级本地化Agent报告太硬核！

各位对Agent Skill早已轻车熟路。不可否认，在Claude code、Openclaw的加持下，这套框架效果极佳。但工业界的痛点在于：它几乎沦为了超大型闭源API的专属玩具。当您的项目面临金融

来自主题: AI技术研报

7902 点击 2026-02-27 10:48

首次证实RL能让3D模型学会推理，复杂文本描述下生成质量跃升！

当GRPO让大模型在数学、代码推理上实现质变，研究团队率先给出答案——首个将强化学习系统性引入文本到3D自回归生成的研究正式诞生，并被CVPR 2026接收。该研究不只是简单移植2D经验，而是针对3D生成的独特挑战，从奖励设计、算法选择、评测基准到训练范式，做了一套完整的系统性探索。

来自主题: AI技术研报

7306 点击 2026-02-27 10:28

李国杰院士：基于可判定性理论的人工智能系统安全风险分类

李国杰院士指出，AI安全风险应按逻辑复杂性分为三类：R1可验证、R2可发现但不可证明安全、R3不可治理。当前AI多属R2，关键不在「证明安全」，而在构建人类主导的制度性刹车机制，拒绝让渡终极控制权。

来自主题: AI技术研报

8651 点击 2026-02-26 12:13

大语言模型真的会「推理」吗？一项系统性研究梳理 LLM 的结构性推理失败

近期发表于 TMLR 的论文《Large Language Model Reasoning Failures》对这一问题进行了系统性梳理。该研究并未围绕 “模型是否真正理解” 展开哲学层面的争论，而是采取更加务实的路径 —— 通过整理现有文献中的失败现象，构建统一框架，系统分析大语言模型的推理短板。

来自主题: AI技术研报

7638 点击 2026-02-26 10:52