AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
ICRA 2026|NUS邵林团队提出T(R,O) Grasp:刷新跨智能体灵巧抓取SOTA,实现5FPS动态环境交互

ICRA 2026|NUS邵林团队提出T(R,O) Grasp:刷新跨智能体灵巧抓取SOTA,实现5FPS动态环境交互

ICRA 2026|NUS邵林团队提出T(R,O) Grasp:刷新跨智能体灵巧抓取SOTA,实现5FPS动态环境交互

T (R,O) Grasp 是一种基于物体 — 机器手空间关系建模的图扩散架构,具备跨智能体的统一表征能力。在 NVIDIA 40GB A100 GPU 上,该方法可实现 5 FPS 的推理速度和 50 grasp/s 的吞吐量,并在多种智能体上取得 94.83% 的平均抓取成功率,刷新了跨智能体灵巧抓取的 SOTA,具备与动态场景实时交互的能力。

来自主题: AI技术研报
6066 点击    2026-04-13 09:38
如何使用Hermes Agent稳定爬取公众号文章

如何使用Hermes Agent稳定爬取公众号文章

如何使用Hermes Agent稳定爬取公众号文章

Browser Use是Hermes Agent官方推荐的云端浏览器自动化提供商之一:

来自主题: AI技术研报
9570 点击    2026-04-13 09:38
ICLR 2026|隐式思考模型LRT:「隐式思维链」推理,更快更强!

ICLR 2026|隐式思考模型LRT:「隐式思维链」推理,更快更强!

ICLR 2026|隐式思考模型LRT:「隐式思维链」推理,更快更强!

近日,哈尔滨工业大学(深圳)联合深圳河套学院、Independent Researcher提出了隐式思考模型 LRT(Latent Reasoning Tuning),通过一个轻量级的推理网络,将大模型冗长的「思维链」压缩为紧凑的隐式向量表征,一次前向计算即可完成推理,无需逐 token 生成数千字的中间推理过程。

来自主题: AI技术研报
9449 点击    2026-04-13 09:35
小模型用不好Skill?新范式SKILL0让模型学会Skill的底层逻辑,3B模型推理token省5倍

小模型用不好Skill?新范式SKILL0让模型学会Skill的底层逻辑,3B模型推理token省5倍

小模型用不好Skill?新范式SKILL0让模型学会Skill的底层逻辑,3B模型推理token省5倍

浙江大学联合美团龙猫团队、清华大学推出全新研究成果——SKILL0,并提出技能内化(Skill Internalization)——小模型真正需要的,或许不是推理时的“外挂技能”,而是将技能内化为本能。

来自主题: AI技术研报
8081 点击    2026-04-12 11:56
Anthropic 官方指南:怎么给 Agent 设计工具

Anthropic 官方指南:怎么给 Agent 设计工具

Anthropic 官方指南:怎么给 Agent 设计工具

本文翻译自 Anthropic 官方博客「Seeing like an agent: how we design tools in Claude Code」,作者 Thariq Shihipar,Claude Code 团队工程师,今天发布。以下为逐段中英对照翻译

来自主题: AI技术研报
7534 点击    2026-04-12 11:28
循环即实验室:八个AI自主研究系统横评

循环即实验室:八个AI自主研究系统横评

循环即实验室:八个AI自主研究系统横评

今天 Interesting Engineering++ 发了一篇长文,把这些系统放在同一个分析框架里做了横评,回答的就是这些问题。原文地址:interestingengineering.substack.com/p/the-loop-is-the-lab

来自主题: AI技术研报
9518 点击    2026-04-11 14:22
OpenClaw的风刮到了多模态生成,6B小模型超越Nano Banana 2!

OpenClaw的风刮到了多模态生成,6B小模型超越Nano Banana 2!

OpenClaw的风刮到了多模态生成,6B小模型超越Nano Banana 2!

近日,上海人工智能实验室联合南京大学、香港中文大学及上海交通大学,将OpenClaw的成功应用于多模态生成领域。他们提出GEMS(Agent-Native Multimodal Generation with Memory and Skills),激发小模型潜力,甚至让6B小模型在部分任务超越了Nano Banana 2。

来自主题: AI技术研报
7799 点击    2026-04-11 10:36
大模型能“原地”改参数了!字节Seed&北大新论文:测试时推理无需加层重训练

大模型能“原地”改参数了!字节Seed&北大新论文:测试时推理无需加层重训练

大模型能“原地”改参数了!字节Seed&北大新论文:测试时推理无需加层重训练

字节Seed最新研究,让大模型能“原地改参数”了。既不用改模型结构,也不用重新训练,还跑得很快。具体是这么个情况。智能体时代嘛,大家都知道模型们面对的任务开始变得越来越复杂、上下文越来越长。

来自主题: AI技术研报
8159 点击    2026-04-11 10:25
多模态幻觉的病因「高熵节点」找到了!全基准幻觉率下降

多模态幻觉的病因「高熵节点」找到了!全基准幻觉率下降

多模态幻觉的病因「高熵节点」找到了!全基准幻觉率下降

多模态大推理模型的幻觉,很多时候并非「没看见」,而是在最不确定的推理阶段想偏了。最新研究发现,模型在生成because、however、wait等transition words时,往往处于高熵关键节点,更容易脱离图像证据、转向语言脑补。LEAD在高熵阶段不急于输出单一离散token,而是先在潜在语义空间保留多种候选推理方向,并通过视觉锚点持续拉回图像证据,显著缓解幻觉。

来自主题: AI技术研报
9009 点击    2026-04-11 09:37
2026年第一季度,AI Agent完成了它的成人礼|2026 Q1 AI趋势白皮书

2026年第一季度,AI Agent完成了它的成人礼|2026 Q1 AI趋势白皮书

2026年第一季度,AI Agent完成了它的成人礼|2026 Q1 AI趋势白皮书

2026 年第一季度,它和另外四种完全不同的 Agent 产品形态在同一个窗口期同时冒了出来。OpenClaw 走个人助理、Cowork 走办公协作、Codex App 走长程工程任务、Perplexity Computer 走统一工作站、腾讯云 ADP 走企业平台。

来自主题: AI技术研报
7576 点击    2026-04-10 15:59
库里被「采访」、杨紫被「演」短剧?别慌!蚂蚁AI鉴真拿下CVPR 2026冠军,专治黑产

库里被「采访」、杨紫被「演」短剧?别慌!蚂蚁AI鉴真拿下CVPR 2026冠军,专治黑产

库里被「采访」、杨紫被「演」短剧?别慌!蚂蚁AI鉴真拿下CVPR 2026冠军,专治黑产

最近,计算机视觉领域的顶级会议 CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛( Robust AI-Generated Image Detection in the Wild Challenge )结果出炉。蚂蚁集团 AI 安全实验室的队伍 MICV 凭借在鲁棒性测试样本上 ROC AUC 达到了惊人的 0.9723,成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。

来自主题: AI技术研报
9489 点击    2026-04-10 15:57
视频生成不再「断片」:OneStory给模型装上「选择性记忆」,跨镜头讲故事人物场景始终如一丨CVPR'26

视频生成不再「断片」:OneStory给模型装上「选择性记忆」,跨镜头讲故事人物场景始终如一丨CVPR'26

视频生成不再「断片」:OneStory给模型装上「选择性记忆」,跨镜头讲故事人物场景始终如一丨CVPR'26

最近,来自Meta与University of Copenhagen的研究者提出了OneStory: Coherent Multi-Shot Video Generation with Adaptive Memory(收录于CVPR 2026)。这项工作聚焦于一个核心问题:如何在生成多镜头视频时,有效保留长程跨镜头上下文,从而实现更强的叙事一致性。

来自主题: AI技术研报
6531 点击    2026-04-10 15:36
Claude Managed Agents完整上手指南

Claude Managed Agents完整上手指南

Claude Managed Agents完整上手指南

Anthropic 刚刚给所有开发者发了一张快车票。Claude Managed Agents 正式公测,你不需要自己搭 Docker、写沙箱、管状态、做错误恢复——三个 API 调用,十分钟,一个生产级智能体就跑起来了。

来自主题: AI技术研报
8126 点击    2026-04-10 09:42
一个人用AI从零做到月入1万美元:完整工具链拆解

一个人用AI从零做到月入1万美元:完整工具链拆解

一个人用AI从零做到月入1万美元:完整工具链拆解

2026 年,44% 的盈利 SaaS 产品是一个人做出来的。有人一个人搞了一组微型产品,月入 2.8 万美元。有人辞掉年薪 4.2 万的工作,8 个月后两个产品月入 3 万。

来自主题: AI技术研报
6055 点击    2026-04-10 09:08
完了,AI学会抱团对抗人类:7个模型宁愿造假,也不出卖「同伴」

完了,AI学会抱团对抗人类:7个模型宁愿造假,也不出卖「同伴」

完了,AI学会抱团对抗人类:7个模型宁愿造假,也不出卖「同伴」

多 Agents 协同方案成了现在 AI 圈的主流玩法,以前是一个 Agent 能搞定一个人要做的事,现在是多个 Agent 完成一个团队要做的事。

来自主题: AI技术研报
5435 点击    2026-04-10 09:07
一文搞懂 Coding Agent 和 Harness

一文搞懂 Coding Agent 和 Harness

一文搞懂 Coding Agent 和 Harness

在这篇文章里,我想介绍编码智能体(Coding agents)以及 Agent harnesses 的整体设计:它们是什么、怎么运作,以及各个零件在实践中怎么拼到一起。

来自主题: AI技术研报
9066 点击    2026-04-10 09:06
15个模板复制粘贴,让同一个AI聪明十倍:上下文工程实战手册

15个模板复制粘贴,让同一个AI聪明十倍:上下文工程实战手册

15个模板复制粘贴,让同一个AI聪明十倍:上下文工程实战手册

Nav Toor 的上一篇上下文工程文章火了——上百万人阅读,上千人私信他同一个问题:"道理我都懂了,但我到底该打什么字?"

来自主题: AI技术研报
7616 点击    2026-04-10 08:37
当 AI 主宰写代码,MoonBit 嵌入「形式化验证」让 Bug 清零

当 AI 主宰写代码,MoonBit 嵌入「形式化验证」让 Bug 清零

当 AI 主宰写代码,MoonBit 嵌入「形式化验证」让 Bug 清零

AI 写代码越来越快,真正的问题却越来越尖锐:生成成本在下降,正确性却不会自动提升。

来自主题: AI技术研报
8956 点击    2026-04-10 08:36
4步生图封神,GenEval从61%狂拉到92%,全面超越GPT-4o的TDM-R1模型来了

4步生图封神,GenEval从61%狂拉到92%,全面超越GPT-4o的TDM-R1模型来了

4步生图封神,GenEval从61%狂拉到92%,全面超越GPT-4o的TDM-R1模型来了

超快速 AI 生图领域再破性能天花板!香港科技大学唐靖团队、香港科技大学(深圳分校)胡天阳、小红书 hi-lab 罗维俭提出全新通用强化学习框架 TDM-R1,精准破解超快速扩散生成的核心痛点 —— 仅需 4 步采样(4 NFE),便将组合式生成指标 GenEval 从 61% 飙升至 92%,

来自主题: AI技术研报
9663 点击    2026-04-10 08:35
Claude封杀龙虾后推自家Agent服务,又被开源平替了

Claude封杀龙虾后推自家Agent服务,又被开源平替了

Claude封杀龙虾后推自家Agent服务,又被开源平替了

刚刚,Claude推出“企业版”服务,发布Claude Managed Agents,结果被开源项目“开团秒跟”!

来自主题: AI技术研报
8801 点击    2026-04-09 15:22
AI私人助理住进了iMessage:两步设置、$49/月,比你自己还懂你的日程

AI私人助理住进了iMessage:两步设置、$49/月,比你自己还懂你的日程

AI私人助理住进了iMessage:两步设置、$49/月,比你自己还懂你的日程

Lindy.ai 的创始人 Flo Crivello 做了件挺大胆的事:把 AI 助理塞进了 iMessage。不是做一个新 App,不是搞一个聊天界面,就是直接出现在你的短信列表里,像一个真人助理一样跟你对话。

来自主题: AI技术研报
6162 点击    2026-04-09 15:21
刚刚,豆包「成精」了!一夜告别机械感,上亿人手机全量上线

刚刚,豆包「成精」了!一夜告别机械感,上亿人手机全量上线

刚刚,豆包「成精」了!一夜告别机械感,上亿人手机全量上线

AI交互的「机械感」消失了!今天,豆包甩出原生全双工语音大模型Seeduplex,不仅能边听边说,甚至能听懂你在思考时的「卡壳」,就算环境再吵也不怕,抗干扰能力直接拉满。

来自主题: AI技术研报
9885 点击    2026-04-09 14:48
TRAE给普通用户,做了更好用的AI工作台

TRAE给普通用户,做了更好用的AI工作台

TRAE给普通用户,做了更好用的AI工作台

不讲 Vibe Coding,而是 Vibe Working。

来自主题: AI技术研报
5781 点击    2026-04-09 14:47