AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
老黄杀入OpenClaw战场!最强开源「龙虾」模型直逼Opus 4.6

老黄杀入OpenClaw战场!最强开源「龙虾」模型直逼Opus 4.6

老黄杀入OpenClaw战场!最强开源「龙虾」模型直逼Opus 4.6

OpenClaw又迎重磅玩家!英伟达深夜带着Nemotron 3 Super炸场,1200亿参数专为Agent打造,性能直逼Claude Opus 4.6。推理狂飙3倍,吞吐量猛涨5倍,「龙虾」这是要上天了。

来自主题: AI技术研报
8391 点击    2026-03-12 14:54
编程 Agent 如何重塑工程、产品和设计

编程 Agent 如何重塑工程、产品和设计

编程 Agent 如何重塑工程、产品和设计

软件公司的 EPD(工程 Engineering、产品 Product、设计 Design)存在的意义就是做出好软件。虽然分了不同角色,但最终目标一样:做出能解决业务问题、用户用得上的功能软件。说到底,产出就是代码。这一点必须认清——因为编程 Agent 突然让写代码变得异常简单。那么,EPD 的角色定位会怎么变?

来自主题: AI技术研报
8925 点击    2026-03-12 14:49
从向量里逆向出原始文本和模型来源

从向量里逆向出原始文本和模型来源

从向量里逆向出原始文本和模型来源

用户把文本发到我们的 API,我们返回一串浮点数。没有标签,没有水印,没有任何元数据告诉你它从哪来、用的什么模型。大多数人看到这串数字,反应都是"不就是一堆浮点数嘛,能看出什么?"

来自主题: AI技术研报
6999 点击    2026-03-12 14:12
CVPR 2026 | 还在为AI「鬼画符」发愁?TextPecker即插即用破解文字渲染难题

CVPR 2026 | 还在为AI「鬼画符」发愁?TextPecker即插即用破解文字渲染难题

CVPR 2026 | 还在为AI「鬼画符」发愁?TextPecker即插即用破解文字渲染难题

在生成式 AI 浪潮中,文生图技术已实现跨越式发展,在视觉呈现上达到了前所未有的高度。然而,在生成图像中准确合成拼写正确、结构规范且风格协调的文字 —— 视觉文本渲染(Visual Text Rendering, VTR),至今仍是该领域尚未攻克的核心难题。

来自主题: AI技术研报
8907 点击    2026-03-12 14:10
2026年最"无聊"的AI商业模式,为什么反而最赚钱

2026年最"无聊"的AI商业模式,为什么反而最赚钱

2026年最"无聊"的AI商业模式,为什么反而最赚钱

Ben在视频中提到了一个令人震惊的数据对比。虽然ChatGPT的使用率在飞速增长,企业也在疯狂尝试各种AI解决方案,但真正能看到商业价值的却少之又少。根据MIT的研究,在供应商销售的AI解决方案中,只有5%的试点项目最终进入了生产环境。Deloitte(德勤)发现只有15%的组织表示他们从AI中获得了显著的、可衡量的ROI。

来自主题: AI技术研报
8688 点击    2026-03-12 11:23
连Gemini都直呼“着迷”的木马,如果你的龙虾token耗太快,是该注意「Clawdrain攻击」了

连Gemini都直呼“着迷”的木马,如果你的龙虾token耗太快,是该注意「Clawdrain攻击」了

连Gemini都直呼“着迷”的木马,如果你的龙虾token耗太快,是该注意「Clawdrain攻击」了

想象您是一名渗透测试工程师,面前是前几天宣布完成安全升级的OpenClaw 3.8。您不需要去找RCE(远程代码执行),也不用费劲构造缓冲区溢出。您只需要回想一下,近期在网上发生过的两场OpeClaw“闹剧”。第一次Meta AI的对齐总监眼睁睁看着自己的OpenClaw开始疯狂清空她的历史邮件。

来自主题: AI技术研报
7307 点击    2026-03-12 10:17
突破万次连续编辑极限!中科院提出首个理论保稳的知识保留方法

突破万次连续编辑极限!中科院提出首个理论保稳的知识保留方法

突破万次连续编辑极限!中科院提出首个理论保稳的知识保留方法

LyapLock首次让大模型在上万次知识更新中稳住旧记忆、精准学新知。它用「虚拟队列」实时监控遗忘风险,动态平衡新旧知识,理论保证长期不崩盘,编辑效果比主流方法提升11.89%,还能赋能现有模型,让AI真正学会「持续成长」。

来自主题: AI技术研报
10031 点击    2026-03-12 10:16
2026 开年这篇综述,把高效 Agents 讲得很工程(附落地清单)

2026 开年这篇综述,把高效 Agents 讲得很工程(附落地清单)

2026 开年这篇综述,把高效 Agents 讲得很工程(附落地清单)

上周有个朋友跟我吐槽,说他们线上跑的 Agent,单次任务 token 消耗到了六位数。

来自主题: AI技术研报
5676 点击    2026-03-12 09:54
视频生成太慢?英伟达、谢赛宁等发布TMD框架,实现70倍加速

视频生成太慢?英伟达、谢赛宁等发布TMD框架,实现70倍加速

视频生成太慢?英伟达、谢赛宁等发布TMD框架,实现70倍加速

近年来,大规模视频扩散模型在视频生成领域取得了显著进展。然而,采样效率低下仍然是这类模型的核心瓶颈。

来自主题: AI技术研报
8553 点击    2026-03-11 15:05
物理AI的「原生」时刻:原力灵机发布具身大模型DM0

物理AI的「原生」时刻:原力灵机发布具身大模型DM0

物理AI的「原生」时刻:原力灵机发布具身大模型DM0

当前,大语言模型(LLMs)和视觉语言模型(VLMs)在语义领域的成功未能直接迁移至物理机器人,归根结底在于其互联网原生的基因。

来自主题: AI技术研报
5529 点击    2026-03-11 15:04
不平衡数据下对比学习的理论分析:从训练动态到剪枝解决方案

不平衡数据下对比学习的理论分析:从训练动态到剪枝解决方案

不平衡数据下对比学习的理论分析:从训练动态到剪枝解决方案

对比学习已成为表征学习中的一种强大范式,能够在不依赖标签的情况下有效利用无标注数据。

来自主题: AI技术研报
6984 点击    2026-03-11 15:03
[小山译] Claude Skill 编写与实战指南

[小山译] Claude Skill 编写与实战指南

[小山译] Claude Skill 编写与实战指南

最近沉迷折腾龙虾,想把日常工作都 Skill 化,试了挺多方法都不怎么好用。正好最近 Anthropic 出了一份官方指南,我边学边翻,分享给你。

来自主题: AI技术研报
7534 点击    2026-03-11 10:02
CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

大家是否有这样的感觉?给定几张场景中拍摄的图片,往往能够在脑海中想象出这个场景的三维布局,然而当前的多模态大模型还停留于纯文本或者 2D 视觉的推理表示,限制了图像中隐含几何结构的表达能力。

来自主题: AI技术研报
8182 点击    2026-03-11 09:25
ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

NUS、ZJU、UW、Stanford、CUHK 联合提出 「ThinkMorph」,主张让文字与图像在统一架构里「原生协作」、「共同演化」,而不是像当下大多数多模态模型那样,看完图像就闭上眼睛,后续完全靠文字链条推进。仅用 2.4 万条数据微调 7B 统一模型,视觉推理平均提升 34.74%,多项任务比肩甚至超越 GPT-4o 和 Gemini 2.5 Flash。

来自主题: AI技术研报
6248 点击    2026-03-11 09:22
a16z全球AI产品Top100:AI入口之争已经打响,OpenClaw开启通用Agent时代

a16z全球AI产品Top100:AI入口之争已经打响,OpenClaw开启通用Agent时代

a16z全球AI产品Top100:AI入口之争已经打响,OpenClaw开启通用Agent时代

三年前,我们发布了这份榜单的第一版,目标很简单:找出哪些生成式 AI 产品真正被主流消费者使用。在当时,「AI 原生」公司和其他公司之间的界限很清晰。ChatGPT、Midjourney 和 Character.AI 都是围绕基础模型从零构建的产品,而软件行业的其他玩家还在摸索这项技术该怎么用。

来自主题: AI技术研报
10141 点击    2026-03-10 14:36
拖拽视频编辑进入流式时代!任意时刻、任意内容,实时修改 | ICLR'26

拖拽视频编辑进入流式时代!任意时刻、任意内容,实时修改 | ICLR'26

拖拽视频编辑进入流式时代!任意时刻、任意内容,实时修改 | ICLR'26

DragStream,首次实现视频生成时的实时拖拽编辑。用户可随时拖动画面中的物体,自由平移、旋转或变形,系统自动保持后续帧连贯自然,无需重训模型,无缝适配主流AI视频生成器,真正实现「所见即所得」。

来自主题: AI技术研报
7577 点击    2026-03-10 14:32
正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

如果你在过去一年关注过大模型训练的技术,大概率听过 Muon 这个名字 —— 这个在月之暗面 K2 模型的相关讨论中走红的优化器,被视为是可能挑战 Adam 的新秀。它的思路很直接:对动量矩阵进行正交化,让各个奇异方向上的更新速率一致,提升训练效率。

来自主题: AI技术研报
5788 点击    2026-03-10 14:31
从训练到推理的「瘦身」演进:首篇高效扩散语言模型(dLLM)深度综述

从训练到推理的「瘦身」演进:首篇高效扩散语言模型(dLLM)深度综述

从训练到推理的「瘦身」演进:首篇高效扩散语言模型(dLLM)深度综述

在生成式 AI 的浪潮中,自回归(Autoregressive, AR)模型凭借其卓越的性能占据了统治地位。然而,其「从左到右」逐个预测 Token 的串行机制,天生限制了并行生成的可能性。

来自主题: AI技术研报
6012 点击    2026-03-10 14:29