AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到跨层电路。但在很多场景里,研究者真正关心的不只是 “模型为什么这么答”,还包括 “能不能更稳、更准、更省,更安全”。

来自主题: AI技术研报
10522 点击    2026-01-28 10:13
持续怒斩53K星!狠人揭秘Clawdbot反行业记忆系统!跟ChatGPT大不同:不靠狂塞上下文,而是一个个md文件!网友:AI记忆第一次被工程化了

持续怒斩53K星!狠人揭秘Clawdbot反行业记忆系统!跟ChatGPT大不同:不靠狂塞上下文,而是一个个md文件!网友:AI记忆第一次被工程化了

持续怒斩53K星!狠人揭秘Clawdbot反行业记忆系统!跟ChatGPT大不同:不靠狂塞上下文,而是一个个md文件!网友:AI记忆第一次被工程化了

过去一年,几乎所有 AI 产品都在谈一个词:记忆。

来自主题: AI技术研报
6936 点击    2026-01-27 16:52
DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

DeepSeek开源DeepSeek-OCR2,引入了全新的DeepEncoder V2视觉编码器。该架构打破了传统模型按固定顺序(从左上到右下)扫描图像的限制,转而模仿人类视觉的「因果流(Causal Flow)」逻辑。

来自主题: AI技术研报
6342 点击    2026-01-27 16:51
机器人看不清,蚂蚁给治好了

机器人看不清,蚂蚁给治好了

机器人看不清,蚂蚁给治好了

天下苦机器人看不清透明和反光物体久矣。

来自主题: AI技术研报
7779 点击    2026-01-27 16:19
高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透

高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透

高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透

随着大模型能力的跃迁,业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性(effectiveness):如何让它更聪明、更稳、更会用工具、更能完成复杂任务。

来自主题: AI技术研报
7575 点击    2026-01-27 16:19
思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

在 LLM 时代,思维链( CoT)已成为解锁模型复杂推理能力的关键钥匙。然而,CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用,严重制约了模型的推理效率。

来自主题: AI技术研报
7409 点击    2026-01-27 16:17
让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

思维导图曾被证明可以帮助学习障碍者快速提升成绩,那么当前已经可堪一用的智能体系统如果引入类似工具是否可以帮助改善长期学习记忆能力呢?有研究团队做出了探索性尝试。

来自主题: AI技术研报
6075 点击    2026-01-27 09:40
北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

近日,北京大学朱毅鑫教授课题组、北京大学毕彦超教授课题组和山西医科大学第一医院王效春团队通过结合 AI 模型和大脑损伤患者的数据,发现语言其实是一副无形的智能眼镜,时刻在悄悄修饰着我们看到的世界。我们可能以为视觉就是眼睛看到什么就是什么,但是这项成果说明了视觉从来都不是孤立的。事实上,当我们在看图片的时候,其实不只是在看,而是在进行被语言调制过的看。

来自主题: AI技术研报
8130 点击    2026-01-27 09:27
DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

过去两年,大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上,推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B,开始稳定拉开与传统指令微调模型的差距。直观来看,它们似乎只是思考得更久了:更长的 Chain-of-Thought、更高的 test-time compute,成为最常被引用的解释。

来自主题: AI技术研报
6509 点击    2026-01-26 15:02
再见,人类程序员!OpenAI自曝:一行代码都不写了,100%用Codex

再见,人类程序员!OpenAI自曝:一行代码都不写了,100%用Codex

再见,人类程序员!OpenAI自曝:一行代码都不写了,100%用Codex

100%是用Codex写的。还有内部爆料说,Codex让他们仅用三天时间就搭出了服务器,三周就发布了APP。人类程序员,真的要退出历史舞台了?

来自主题: AI技术研报
9830 点击    2026-01-26 15:02
这套X+Claude Skill+Obsidian工作流,干掉了我90%的选题焦虑

这套X+Claude Skill+Obsidian工作流,干掉了我90%的选题焦虑

这套X+Claude Skill+Obsidian工作流,干掉了我90%的选题焦虑

我一直有一个习惯,就每天都会刷 Twitter。倒也不是为了打发时间,而是因为在 AI 这个领域,Twitter 几乎是最前沿的信息源。新论文、新产品、行业八卦、技术突破,很多时候,等中文媒体跟进报道,已经是三五天后的事了。

来自主题: AI技术研报
7894 点击    2026-01-26 14:59
斯坦福×英伟达发布AI推理新范式,刷新了多领域SOTA

斯坦福×英伟达发布AI推理新范式,刷新了多领域SOTA

斯坦福×英伟达发布AI推理新范式,刷新了多领域SOTA

斯坦福与英伟达联合发布重磅论文 TTT-Discover,打破「模型训练完即定型」的铁律。它让 AI 在推理阶段针对特定难题「现场长脑子」,不惜花费数百美元算力,只为求得一次打破纪录的极值。从重写数学猜想到碾压人类代码速度,这种「激进进化」正在重新定义机器发现的边界。

来自主题: AI技术研报
7569 点击    2026-01-26 14:23
关于多模态大模型Token压缩技术进展,看这一篇就够了

关于多模态大模型Token压缩技术进展,看这一篇就够了

关于多模态大模型Token压缩技术进展,看这一篇就够了

近年来多模态大模型在视觉感知,长视频问答等方面涌现出了强劲的性能,但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token ,带来极高的显存占用和延迟,限制了模型的可扩展性和本地部署。

来自主题: AI技术研报
9452 点击    2026-01-26 14:22
AI圈开年王炸:Agent Skill 正式登场

AI圈开年王炸:Agent Skill 正式登场

AI圈开年王炸:Agent Skill 正式登场

2026 年才开始,全球 AI 行业就迎来了第一个开年王炸。不是来自某个更大的模型参数,不是某家实验室刷新了榜单分数,而是一个看似不起眼、却迅速破圈的概念——Agent Skill。

来自主题: AI技术研报
6948 点击    2026-01-26 14:21
AAAI 2026杰出论文奖 | ReconVLA:具身智能研究首次获得AI顶级会议最佳论文奖

AAAI 2026杰出论文奖 | ReconVLA:具身智能研究首次获得AI顶级会议最佳论文奖

AAAI 2026杰出论文奖 | ReconVLA:具身智能研究首次获得AI顶级会议最佳论文奖

在长期以来的 AI 研究版图中,具身智能虽然在机器人操作、自动化系统与现实应用中至关重要,却常被视为「系统工程驱动」的研究方向,鲜少被认为能够在 AI 核心建模范式上产生决定性影响。

来自主题: AI技术研报
7233 点击    2026-01-26 14:21
还得是腾讯,Claude Code迎来最强中国对手!企业Agent有救了~

还得是腾讯,Claude Code迎来最强中国对手!企业Agent有救了~

还得是腾讯,Claude Code迎来最强中国对手!企业Agent有救了~

大家好,我是最近天天折腾CLI Agent的袋鼠帝。 一周前,我给大家安利了一款Claude Code的最强开源对手:OpenCode,没想到文章发出去后反响这么热烈,不管是阅读量还是评论都非常多。刚好,前几天我看到腾讯的CodeBuddy Code重磅升级到了2.0版本。说实话,CodeBuddy Code我有用过,基本完全复刻Claude Code,之前还帮我开发了好几个小工具,很实用。

来自主题: AI技术研报
8812 点击    2026-01-26 11:31
谷歌Gemini在“搜索”领域仍具有绝对统治力。深度研究智能体到底该怎么选?OSU & Amazon最新

谷歌Gemini在“搜索”领域仍具有绝对统治力。深度研究智能体到底该怎么选?OSU & Amazon最新

谷歌Gemini在“搜索”领域仍具有绝对统治力。深度研究智能体到底该怎么选?OSU & Amazon最新

面对琳琅满目的Deep Research Agent(深度研究智能体),究竟该如何选型?本文基于OSU与Amazon最新发布的MMDR-Bench论文,为您提供一份经过严谨科学验证的“避坑指南”。结论先行:综合任务首选谷歌Gemini Deep Research,而涉及计算机科学与数据结构的硬核任务,GPT-5.2依然是专家首选。

来自主题: AI技术研报
7969 点击    2026-01-26 11:29
Cursor不香了?前0.01%大神倒戈Claude,万字叛逃笔记爆火!

Cursor不香了?前0.01%大神倒戈Claude,万字叛逃笔记爆火!

Cursor不香了?前0.01%大神倒戈Claude,万字叛逃笔记爆火!

一个曾被Cursor官方盖章认定的全球前0.01%顶级玩家,却在Claude Code 2.0发布后果断「倒戈」!这不只是换工具,而是底层的游戏规则已经悄悄换了。

来自主题: AI技术研报
6628 点击    2026-01-26 11:26
混合检索系列之:Milvus 地理几何字段与 R-Tree 索引技术详解

混合检索系列之:Milvus 地理几何字段与 R-Tree 索引技术详解

混合检索系列之:Milvus 地理几何字段与 R-Tree 索引技术详解

在向量数据库的工程实践中,处理多模态数据,特别是结合地理位置(LBS)与非结构化语义数据,一直是一个复杂的架构挑战。

来自主题: AI技术研报
7763 点击    2026-01-26 10:20
第一梯队的大模型安全吗?复旦、上海创智学院等发布前沿大模型安全报告,覆盖六大领先模型

第一梯队的大模型安全吗?复旦、上海创智学院等发布前沿大模型安全报告,覆盖六大领先模型

第一梯队的大模型安全吗?复旦、上海创智学院等发布前沿大模型安全报告,覆盖六大领先模型

随着大语言模型加速迈向多模态与智能体形态,传统以单一维度为主的安全评估体系已难以覆盖真实世界中的复杂风险图景。在模型能力持续跃升的 2026 年,开发者与用户也愈发关注一个核心问题:前沿大模型的安全性,到底如何?

来自主题: AI技术研报
9924 点击    2026-01-26 10:20
音频-视觉全模态的未来预测,FutureOmni给出了首份答卷

音频-视觉全模态的未来预测,FutureOmni给出了首份答卷

音频-视觉全模态的未来预测,FutureOmni给出了首份答卷

复旦大学、上海创智学院与新加坡国立大学联合推出首个全模态未来预测评测基准 FutureOmni,要求模型从音频 - 视觉线索中预测未来事件,实现跨模态因果和时间推理。

来自主题: AI技术研报
5619 点击    2026-01-26 10:19
一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

一张图生成任意场景3D模型,部分遮挡也不怕|IDEA x 光影焕像联合开源

IDEA研究院张磊团队与香港科技大学谭平团队联合推出SceneMaker框架,有望攻克这一问题。 它以视启未来的万物检测模型DINO-X与光影焕像的万物3D生成模型Triverse为基础,实现了从任意开放世界图像(室内/室外/合成图等)到带Mesh的3D场景的完整重建。

来自主题: AI技术研报
8533 点击    2026-01-26 10:16
“Skill 不就是长一点的提示词吗?”

“Skill 不就是长一点的提示词吗?”

“Skill 不就是长一点的提示词吗?”

上篇文章别把整个 GitHub 装进 Skills,Skills 的正确用法发出去后,收到一些质疑:“说 skill 能做配图 prompt 不行。本来 skill 就是加载 md,没 skill 之前我们用 prompt 模板照样也是能做流程编排。” “现在大部分 skill 不就是长一点的提示词吗?为什么说'单纯靠提示词做不了'?”

来自主题: AI技术研报
7584 点击    2026-01-25 11:59
别把整个 GitHub 装进 Skills,Skills 的正确用法

别把整个 GitHub 装进 Skills,Skills 的正确用法

别把整个 GitHub 装进 Skills,Skills 的正确用法

这篇《Skills 的最正确用法,是将整个 Github 压缩成你自己的超级技能库》绝对是一篇绝佳的入门指南,但也要注意:这种用法,还当不起“最”正确用法。 我不是来抬杠的,而是想聊聊:怎么更好地使用

来自主题: AI技术研报
8552 点击    2026-01-25 11:59