AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

2025 年 1 月 20 日,DeepSeek 发布了推理大模型 DeepSeek-R1,在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。 研究者发现,在数学推理等具有明确答案的任务

来自主题: AI技术研报
6428 点击    2026-02-08 11:52
具身大模型LaST₀:双臂/移动/灵巧手全面新SOTA,首次引入隐空间时空思维链

具身大模型LaST₀:双臂/移动/灵巧手全面新SOTA,首次引入隐空间时空思维链

具身大模型LaST₀:双臂/移动/灵巧手全面新SOTA,首次引入隐空间时空思维链

LaST₀团队 投稿 量子位 | 公众号 QbitAI 近日,至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型,在基于Transformer混

来自主题: AI技术研报
6060 点击    2026-02-08 11:50
AgentDoG:为AI智能体戴上「诊断项圈」

AgentDoG:为AI智能体戴上「诊断项圈」

AgentDoG:为AI智能体戴上「诊断项圈」

随着 AI 智能体(Agent)能力日益强大,其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断,无法告知我们风险的根源。为此,上海人工智能实验室正式开源 Ag

来自主题: AI技术研报
8058 点击    2026-02-08 11:49
像挖币一样挖激活函数?DeepMind搭建「算力矿场」,暴力搜出下一代ReLU

像挖币一样挖激活函数?DeepMind搭建「算力矿场」,暴力搜出下一代ReLU

像挖币一样挖激活函数?DeepMind搭建「算力矿场」,暴力搜出下一代ReLU

一直以来,神经网络的激活函数就像是 AI 引擎中的火花塞。从早期的 Sigmoid、Tanh,到后来统治业界的 ReLU,再到近年来的 GELU 和 Swish,每一次激活函数的演进都伴随着模型性能的提升。但长期以来,寻找最佳激活函数往往依赖于人类直觉或有限的搜索空间。

来自主题: AI技术研报
6417 点击    2026-02-08 11:47
清华研究生开源大一统世界模型:性能超越硅谷标杆40%!

清华研究生开源大一统世界模型:性能超越硅谷标杆40%!

清华研究生开源大一统世界模型:性能超越硅谷标杆40%!

国产开源具身世界模型,直接秒了Pi-0.5,而且还是几位清华硕、博士研究生领衔推出的。这就是由生数科技联合清华大学,正式开源的大一统世界模型——Motus。

来自主题: AI技术研报
7557 点击    2026-02-07 14:09
延迟下降20×,token减少4.4×!突破多智能体「共识」瓶颈

延迟下降20×,token减少4.4×!突破多智能体「共识」瓶颈

延迟下降20×,token减少4.4×!突破多智能体「共识」瓶颈

过去一年,LLM Agent几乎成为所有 AI 研究团队与工业界的共同方向。OpenAI在持续推进更强的推理与工具使用能力,Google DeepMind将推理显式建模为搜索问题,Anthropic则通过规范与自我批判提升模型可靠性。

来自主题: AI技术研报
9906 点击    2026-02-07 14:04
谷歌做了个论文专用版nano banana!顶会级Figure直出

谷歌做了个论文专用版nano banana!顶会级Figure直出

谷歌做了个论文专用版nano banana!顶会级Figure直出

你负责写方法,AI负责画 Figure。 科研打工人,终于等来「画图解放日」。

来自主题: AI技术研报
8372 点击    2026-02-06 12:16
邓明扬一作论文改写生成范式!何恺明也署名了

邓明扬一作论文改写生成范式!何恺明也署名了

邓明扬一作论文改写生成范式!何恺明也署名了

刚刚,何恺明团队提出全新生成模型范式漂移模型(Drifting Models)。

来自主题: AI技术研报
10001 点击    2026-02-06 11:39
Attention真的可靠吗?上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题

Attention真的可靠吗?上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题

Attention真的可靠吗?上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题

近年来,Vision-Language Models(视觉 — 语言模型)在多模态理解任务中取得了显著进展,并逐渐成为通用人工智能的重要技术路线。然而,这类模型在实际应用中往往面临推理开销大、效率受限的问题,研究者通常依赖 visual token pruning 等策略降低计算成本,其中 attention 机制被广泛视为衡量视觉信息重要性的关键依据。

来自主题: AI技术研报
9498 点击    2026-02-06 10:39
Stable-DiffCoder超越自回归模型!扩散模型在代码生成取得新突破

Stable-DiffCoder超越自回归模型!扩散模型在代码生成取得新突破

Stable-DiffCoder超越自回归模型!扩散模型在代码生成取得新突破

扩散语言模型(Diffusion Language Models, DLLMs)因其多种潜在的特性而备受关注,如能加速的非自回归并行生成特性,能直接起草编辑的特性,能数据增强的特性。然而,其模型能力往往落后于同等规模的强力自回归(AR)模型。

来自主题: AI技术研报
10438 点击    2026-02-06 10:37
强化学习远不是最优,CMU刚刚提出最大似然强化学习

强化学习远不是最优,CMU刚刚提出最大似然强化学习

强化学习远不是最优,CMU刚刚提出最大似然强化学习

在大模型时代,从代码生成到数学推理,再到自主规划的 Agent 系统,强化学习几乎成了「最后一公里」的标准配置。

来自主题: AI技术研报
7035 点击    2026-02-06 10:34
美团提出全新多模态统一大模型STAR,GenEval突破0.91,破解“理解-生成”零和困局

美团提出全新多模态统一大模型STAR,GenEval突破0.91,破解“理解-生成”零和困局

美团提出全新多模态统一大模型STAR,GenEval突破0.91,破解“理解-生成”零和困局

近日,美团推出全新多模态统一大模型方案 STAR(STacked AutoRegressive Scheme for Unified Multimodal Learning),凭借创新的 "堆叠自回归架构 + 任务递进训练" 双核心设计,实现了 "理解能力不打折、生成能力达顶尖" 的双重突破。

来自主题: AI技术研报
10518 点击    2026-02-05 13:50
谷歌给「AI解数学题」神话降温:能摘低垂果实,但过程依然痛苦

谷歌给「AI解数学题」神话降温:能摘低垂果实,但过程依然痛苦

谷歌给「AI解数学题」神话降温:能摘低垂果实,但过程依然痛苦

刚刚,谷歌发布了一项新的研究进展:他们用 Gemini 做了一次系统性的数学攻关实验,把目标对准了著名的 Erdős Problems 数据库里 700 个仍被标注为 open(未解决)的猜想。

来自主题: AI技术研报
10066 点击    2026-02-04 17:24
致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

受 Kimi K2 团队启发,SGLang RL 团队成功落地了 INT4 量化感知训练(QAT) 流程方案。通过 “训练端伪量化 + 推理端真实量化(W4A16)” 的方案组合,我们实现了媲美 BF16 全精度训练的稳定性与训推一致性,

来自主题: AI技术研报
6628 点击    2026-02-04 16:32
ICLR 2026 | Rebuttal 是一场「带着镣铐的舞蹈」?港科 RebuttalAgent 用心智理论「读懂」审稿人

ICLR 2026 | Rebuttal 是一场「带着镣铐的舞蹈」?港科 RebuttalAgent 用心智理论「读懂」审稿人

ICLR 2026 | Rebuttal 是一场「带着镣铐的舞蹈」?港科 RebuttalAgent 用心智理论「读懂」审稿人

面对同行评审,许多作者都有过这样的经历:明明回答了审稿人的每一个问题,态度也足够谦卑,为什么最终还是没能打动对方?

来自主题: AI技术研报
7382 点击    2026-02-04 16:30
刚刚,腾讯姚顺雨署名首篇论文发布,「下半场」先搞上下文学习

刚刚,腾讯姚顺雨署名首篇论文发布,「下半场」先搞上下文学习

刚刚,腾讯姚顺雨署名首篇论文发布,「下半场」先搞上下文学习

不久前在 AGI-Next 前沿峰会上,姚顺雨曾分享过一个核心观点:模型想要迈向高价值应用,核心瓶颈就在于能否「用好上下文(Context)」。

来自主题: AI技术研报
7027 点击    2026-02-04 16:26
像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

让模型真正 “能行动”,往往需要一个可执行、可验证的符号世界模型(Symbolic World Model):它不是抽象的文字描述,而是能被规划器或执行器直接调用的形式化定义 —— 例如 PDDL 领域 / 问题,或可运行的环境代码 / 模拟器。

来自主题: AI技术研报
7058 点击    2026-02-03 09:11
Clawdbot 如何搭建永久记忆管理系统:全靠 MD 文档

Clawdbot 如何搭建永久记忆管理系统:全靠 MD 文档

Clawdbot 如何搭建永久记忆管理系统:全靠 MD 文档

Clawdbot(现改名为 OpenClaw) 体验下来,持久的记忆管理系统很是让人惊艳——全天候保持上下文,无限期地记住对话并在此基础上持续深化互动。

来自主题: AI技术研报
7664 点击    2026-02-03 08:45
VL-LN Bench:模拟「边走边问找具体目标」的真实导航场景

VL-LN Bench:模拟「边走边问找具体目标」的真实导航场景

VL-LN Bench:模拟「边走边问找具体目标」的真实导航场景

如果将一台在视觉语言导航(VLN)任务中表现优异的机器人直接搬进家庭场景,往往会遇到不少实际问题。

来自主题: AI技术研报
7795 点击    2026-02-03 08:43
MiniMax M2-her:我们做出了更懂你的 AI

MiniMax M2-her:我们做出了更懂你的 AI

MiniMax M2-her:我们做出了更懂你的 AI

今天,我们分享 MiniMax-M2-her 背后的技术思考。M2-her 也是服务星野/Talkie的底层模型。

来自主题: AI技术研报
7622 点击    2026-02-02 13:25
开源免费!推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台,打通飞书、企业微信、钉钉

开源免费!推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台,打通飞书、企业微信、钉钉

开源免费!推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台,打通飞书、企业微信、钉钉

语析Yuxi-Know 是基于大模型RAG知识库与知识图谱技术构建的智能问答平台,支持多种知识库文件格式,如PDF、TXT、MD、Docx,支持将文件内容转换为向量存储,便于快速检索。

来自主题: AI技术研报
5685 点击    2026-02-02 13:23
挑战用阿里版Claude Cowork跑通Clawdbot5个神级玩法,我Mac Mini可能白买了

挑战用阿里版Claude Cowork跑通Clawdbot5个神级玩法,我Mac Mini可能白买了

挑战用阿里版Claude Cowork跑通Clawdbot5个神级玩法,我Mac Mini可能白买了

起因是这样的, 当我还在跟Mac Mini版满血版Clawdbot PK的时候,发现有人统计了排名前十的Clawdbot常见任务,分别是邮件处理,日历管理(日程提醒和会议安排),控制Claude Code开发,每日简报等,

来自主题: AI技术研报
7295 点击    2026-02-02 13:23
Nature | 清北合作研发全球首个全柔性存算一体AI芯片

Nature | 清北合作研发全球首个全柔性存算一体AI芯片

Nature | 清北合作研发全球首个全柔性存算一体AI芯片

一张薄如纸片、能卷在手指上的柔性芯片(不是柔性印刷电路板,是柔性集成电路),能做什么?

来自主题: AI技术研报
8238 点击    2026-02-02 10:05