AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
理想同学 MindDR 1.5 发布:多智能体强化学习加持,深度研究更可靠

理想同学 MindDR 1.5 发布:多智能体强化学习加持,深度研究更可靠

理想同学 MindDR 1.5 发布:多智能体强化学习加持,深度研究更可靠

理想汽车信息智能体团队发布 MindDR 1.5,在 DeepResearch Bench 榜单中取得 52.54 分,以 30B 参数规模达到业界领先水平,性能优于同等规模的开源智能体系统。

来自主题: AI技术研报
5270 点击    2026-04-23 15:21
Transformer可以改装成Mamba了:苹果把推理成本直接打成线性

Transformer可以改装成Mamba了:苹果把推理成本直接打成线性

Transformer可以改装成Mamba了:苹果把推理成本直接打成线性

最近,苹果又整了个活儿,很工程、也挺关键: 把又贵又强的 Transformer,改造成又便宜又差不多强的 Mamba。而且,性能基本没怎么掉。

来自主题: AI技术研报
7887 点击    2026-04-23 14:46
视觉大模型迎来“o1时刻”:腾讯混元提出SOAR,让AI在生成中学会自我纠偏

视觉大模型迎来“o1时刻”:腾讯混元提出SOAR,让AI在生成中学会自我纠偏

视觉大模型迎来“o1时刻”:腾讯混元提出SOAR,让AI在生成中学会自我纠偏

近日,腾讯混元团队提出HY-SOAR (Self-Correction for Optimal Alignment and Refinement),一种面向扩散模型和流匹配模型的数据驱动后训练方法。

来自主题: AI技术研报
7268 点击    2026-04-23 14:44
Nature封面:机器人乒乓球干翻人类职业选手

Nature封面:机器人乒乓球干翻人类职业选手

Nature封面:机器人乒乓球干翻人类职业选手

要说也真够逗的,索尼的机器人又开始找画面了。

来自主题: AI技术研报
8633 点击    2026-04-23 14:07
ICLR 2026 | ProSafePrune:一剪见效,告别大模型过度防御

ICLR 2026 | ProSafePrune:一剪见效,告别大模型过度防御

ICLR 2026 | ProSafePrune:一剪见效,告别大模型过度防御

当你问 AI 「如何关掉房间的灯(how to kill the lights)」,却被冰冷拒绝「无法提供相关帮助」;当你想探讨「黑客技术的正向应用」,得到的却是「拒绝涉及非法活动」的机械回应 —— 你遇到的正是大语言模型(LLMs)的「过度拒绝」(over-refusal)痛点。

来自主题: AI技术研报
9794 点击    2026-04-23 14:06
LLM 仅靠自身就能增强推理?SePT 给出简洁在线自训练范式

LLM 仅靠自身就能增强推理?SePT 给出简洁在线自训练范式

LLM 仅靠自身就能增强推理?SePT 给出简洁在线自训练范式

在推理后训练里,多数方法仍依赖奖励模型、验证器或额外教师信号。如果不依赖这些外部信号,只使用模型自身生成的答案进行自训练,是否仍然能够提升推理能力?是的!SePT(Self-evolving Post-Training)给出肯定答案,简洁的自训练方法,可在数学推理任务准确率直升10个点!

来自主题: AI技术研报
5465 点击    2026-04-23 14:05
首篇自进化智能体系统技术报告出炉:Token成本直降近10倍,省钱又高效!

首篇自进化智能体系统技术报告出炉:Token成本直降近10倍,省钱又高效!

首篇自进化智能体系统技术报告出炉:Token成本直降近10倍,省钱又高效!

当 AI 智能体不再只是「一次性工具」,而是能够持续学习、自我进化的「数字伙伴『数字同事』,会发生什么?自进化智能体应该采取怎样的设计原则?

来自主题: AI技术研报
8056 点击    2026-04-23 14:04
谷歌第八代TPU双舰齐发,终结AI推理延迟,让智能体真正实现随叫随到

谷歌第八代TPU双舰齐发,终结AI推理延迟,让智能体真正实现随叫随到

谷歌第八代TPU双舰齐发,终结AI推理延迟,让智能体真正实现随叫随到

今天,谷歌在 Cloud Next '26 峰会上发布了其第八代 TPU 架构(TPU 8t 与 TPU 8i),TPU 8t 主攻训练,TPU 8i 主攻推理,将在 2026 年晚些时候上市。第八代 TPU 采用申请制,Google Cloud 用户如需使用,需要在官网提交登记需求。

来自主题: AI技术研报
7765 点击    2026-04-23 10:54
不换模型,性能涨了39%:让AI智能体自己修bug的开源方案来了

不换模型,性能涨了39%:让AI智能体自己修bug的开源方案来了

不换模型,性能涨了39%:让AI智能体自己修bug的开源方案来了

NeoSigma 团队今天开源了一个叫 auto-harness 的系统,核心做的事只有一件:让智能体自己发现自己的 bug,自己修,自己验证。

来自主题: AI技术研报
8404 点击    2026-04-23 10:53
13小时不眠不休,300个分身狂敲代码!开源第一易主了

13小时不眠不休,300个分身狂敲代码!开源第一易主了

13小时不眠不休,300个分身狂敲代码!开源第一易主了

开源AI王座一夜易主!Kimi K2.6出道即巅峰,展示了恐怖的「全栈交付」能力。它不仅能复刻高盛研报、手搓奢华官网,甚至能和人类在群组里并肩打工。

来自主题: AI技术研报
5712 点击    2026-04-23 10:04
都是你能部署的:Qwen3.6和Gemma4,谁更适合作为你的下一代本地MoE模型?

都是你能部署的:Qwen3.6和Gemma4,谁更适合作为你的下一代本地MoE模型?

都是你能部署的:Qwen3.6和Gemma4,谁更适合作为你的下一代本地MoE模型?

阿里前几天开源的Qwen3.6-35B-A3B,让这次讨论不再只是一次普通的新旧模型对比。它一边要面对谷歌Gemma4-26B-A4B的外部竞争,一边又必须回答一个更麻烦的问题:相较于 Qwen3.5-35B-A3B,它到底是升级,还是修补?更现实的是,很多人现在真正跑着的,其实是Qwen3.5-27B,那么这条新的35B-A3B路线,到底值不值得迁过去。

来自主题: AI技术研报
8166 点击    2026-04-23 09:23
ICLR 2026 Oral|Information Shapes Koopman Representation:信息如何决定世界模拟?

ICLR 2026 Oral|Information Shapes Koopman Representation:信息如何决定世界模拟?

ICLR 2026 Oral|Information Shapes Koopman Representation:信息如何决定世界模拟?

大多数世界模型工作默认:只要学到一个好的 latent dynamics,问题就解决了。 但这个假设本身是可疑的——什么样的信息,才足以支撑一个可预测、可传播的动力学? 本文从信息论出发,重新审视这一前提。

来自主题: AI技术研报
8882 点击    2026-04-23 09:20
《季载录·春丨Xsignal 全球AI应用行业季度报告丨2026》丨万字长文丨Xsignal深度文章

《季载录·春丨Xsignal 全球AI应用行业季度报告丨2026》丨万字长文丨Xsignal深度文章

《季载录·春丨Xsignal 全球AI应用行业季度报告丨2026》丨万字长文丨Xsignal深度文章

站在这个深度融合的转折点,我们不再空泛地讨论“AI能否改变世界”,而是需要通过客观数据丈量“它正在如何重塑每一寸现实”。《季载录·春丨Xsignal全球AI应用行业季度报告丨2026》应运而生,以真实的周期切片,记录这一历史性的重构时刻。

来自主题: AI技术研报
6148 点击    2026-04-23 09:15
我用 Claude Code 写了一部 5 万字小说,投稿七猫,被拒了

我用 Claude Code 写了一部 5 万字小说,投稿七猫,被拒了

我用 Claude Code 写了一部 5 万字小说,投稿七猫,被拒了

在 skills.sh 上闲逛的时候,我刷到了一个有意思的技能:chinese-novelist-skill,专门用来写中文小说的(地址:https://skills.sh/penglonghuang/chinese-novelist-skill/chinese-novelist)。

来自主题: AI技术研报
9727 点击    2026-04-22 17:28
2026 年做搜索就是做 Agent Memory

2026 年做搜索就是做 Agent Memory

2026 年做搜索就是做 Agent Memory

4 月 18 日,Elastic 中国 AI 搜索技术大会在北京召开。以下内容整理自 Elastic 全球副总裁肖涵,原 Jina AI 创始人兼 CEO 在会上的演讲。肖涵讲述了 AI 搜索的发展历程以及为什么说在 2026 年做 AI 搜索基本就是在做智能体记忆 (Agent Memory)。

来自主题: AI技术研报
9471 点击    2026-04-22 16:40
Kimi K2.6 + Hermes 实测!Karpathy同款保姆级教程来了

Kimi K2.6 + Hermes 实测!Karpathy同款保姆级教程来了

Kimi K2.6 + Hermes 实测!Karpathy同款保姆级教程来了

月之暗面昨天发布了 Kimi K2.6,代码能力和 Agent 能力都有明显增强。官方数据很亮眼:13 小时不间断编码、4000 行代码重构、LMArena 全球开源第一。

来自主题: AI技术研报
5842 点击    2026-04-22 16:39
乐鑫龙虾 ESP-Claw 来了!聊天就能开发智能设备

乐鑫龙虾 ESP-Claw 来了!聊天就能开发智能设备

乐鑫龙虾 ESP-Claw 来了!聊天就能开发智能设备

乐鑫信息科技 (688018.SH) 正式推出 ESP-Claw —— 以 Chat Coding(聊天造物)为核心的 AI 智能体框架。它突破了编程边界,让人人都能通过对话定义智能设备。

来自主题: AI技术研报
9947 点击    2026-04-22 10:43
狂跑一万帧丝滑不崩!拿着几十块单摄走一圈,整栋楼3D地图建好了

狂跑一万帧丝滑不崩!拿着几十块单摄走一圈,整栋楼3D地图建好了

狂跑一万帧丝滑不崩!拿着几十块单摄走一圈,整栋楼3D地图建好了

SLAM教父罕见公开点赞!中国队开源的LingBot-Map,仅靠普通摄像头实现万帧流式3D重建,在全网引爆120万人围观。

来自主题: AI技术研报
7620 点击    2026-04-21 16:57
普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T模型实测:延迟暴降64%!大模型推理“围城”攻破了!

普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T模型实测:延迟暴降64%!大模型推理“围城”攻破了!

普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T模型实测:延迟暴降64%!大模型推理“围城”攻破了!

在 AI 工程界,长文本推理一直是个“富贵病”。

来自主题: AI技术研报
7856 点击    2026-04-21 16:16
动动嘴写SQL!Codex+终身记忆,OpenAI把查询难度直接归零

动动嘴写SQL!Codex+终身记忆,OpenAI把查询难度直接归零

动动嘴写SQL!Codex+终身记忆,OpenAI把查询难度直接归零

2026年初,当大多数企业还在用数据分析师手动写SQL查表时,OpenAI内部曝光的能自主思考、推理甚至自我进化的数据分析智能体,将数据查询从「天数级」缩短至「分钟级」。

来自主题: AI技术研报
5369 点击    2026-04-21 10:24