AI资讯新闻榜单内容搜索-视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉
CVPR 2026 | 摆脱相机依赖!M4Human推动毫米波人体感知迈向新阶段

CVPR 2026 | 摆脱相机依赖!M4Human推动毫米波人体感知迈向新阶段

CVPR 2026 | 摆脱相机依赖!M4Human推动毫米波人体感知迈向新阶段

想象几个并不遥远的场景: 医院的病房里,刚做完手术的患者正在练习下床、走动,智能系统通过摄像头捕捉他的动作,判断步态是否稳定、有没有跌倒风险;回到家,在卧室或浴室这样私密的空间里,老人起身、转身、洗漱,甚至意外滑倒的瞬间,也可能被视觉传感器记录,只为了让 AI 能更早发现异常;

来自主题: AI技术研报
8291 点击    2026-04-13 13:50
多模态幻觉的病因「高熵节点」找到了!全基准幻觉率下降

多模态幻觉的病因「高熵节点」找到了!全基准幻觉率下降

多模态幻觉的病因「高熵节点」找到了!全基准幻觉率下降

多模态大推理模型的幻觉,很多时候并非「没看见」,而是在最不确定的推理阶段想偏了。最新研究发现,模型在生成because、however、wait等transition words时,往往处于高熵关键节点,更容易脱离图像证据、转向语言脑补。LEAD在高熵阶段不急于输出单一离散token,而是先在潜在语义空间保留多种候选推理方向,并通过视觉锚点持续拉回图像证据,显著缓解幻觉。

来自主题: AI技术研报
8994 点击    2026-04-11 09:37
库里被「采访」、杨紫被「演」短剧?别慌!蚂蚁AI鉴真拿下CVPR 2026冠军,专治黑产

库里被「采访」、杨紫被「演」短剧?别慌!蚂蚁AI鉴真拿下CVPR 2026冠军,专治黑产

库里被「采访」、杨紫被「演」短剧?别慌!蚂蚁AI鉴真拿下CVPR 2026冠军,专治黑产

最近,计算机视觉领域的顶级会议 CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛( Robust AI-Generated Image Detection in the Wild Challenge )结果出炉。蚂蚁集团 AI 安全实验室的队伍 MICV 凭借在鲁棒性测试样本上 ROC AUC 达到了惊人的 0.9723,成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。

来自主题: AI技术研报
9464 点击    2026-04-10 15:57
让机器人学会手往哪儿伸、怎么操作,东大团队给了新解法

让机器人学会手往哪儿伸、怎么操作,东大团队给了新解法

让机器人学会手往哪儿伸、怎么操作,东大团队给了新解法

在具身智能领域,可供性(affordance)预测 —— 即让机器人从视觉观测中理解 "在哪里操作"(接触点)与 "如何操作"(动作方向)—— 是实现精细化机器人操作的基础之一。精细操作要求机器人不仅能定位到物体的可交互区域,更要掌握接触后的准确运动方向,例如判断抽屉把手的精确拉动方向完成开合。

来自主题: AI技术研报
8685 点击    2026-04-09 09:47
关于具身智能「触觉」,你想知道的都在这篇综述里了

关于具身智能「触觉」,你想知道的都在这篇综述里了

关于具身智能「触觉」,你想知道的都在这篇综述里了

在具身智能的感知拼图中,触觉一直扮演着不可或缺却难以被完美量化的角色。它提供了视觉等远程传感器无法替代的关于接触几何、材料特性和交互动态的直接反馈。

来自主题: AI技术研报
6678 点击    2026-04-08 09:14
用雨伞「钓」无人机?首个针对自主目标跟踪闭环系统的物理攻击

用雨伞「钓」无人机?首个针对自主目标跟踪闭环系统的物理攻击

用雨伞「钓」无人机?首个针对自主目标跟踪闭环系统的物理攻击

研究者用特制雨伞干扰无人机视觉系统,让其误判目标在远去,从而失控俯冲。FlyTrap攻击无需信号干扰,仅靠物理图案就能欺骗多款商用无人机,实现静默捕获或击毁。实验显示,物理闭环攻击成功率超60%,且对新人物、新场景均有强泛化能力。这项研究揭示了AI感知系统的重大安全隐患,警示我们:视觉安全正成为智能设备的阿喀琉斯之踵。

来自主题: AI技术研报
9865 点击    2026-04-07 14:28
拍照即交互、专为Z世代打造,Chance AI做了世界首款视觉Agent产品

拍照即交互、专为Z世代打造,Chance AI做了世界首款视觉Agent产品

拍照即交互、专为Z世代打造,Chance AI做了世界首款视觉Agent产品

一款 AI 产品出现在了国际顶级的艺术展览中,而且是充当解说员的身份。Chance AI 作为这届博览会官方引入的首个 AI 产品,负责帮观众解读艺术品。观众举起手机,对准一幅画,拍照即交互,听 AI 解释:这件作品为什么成立,它背后意味着什么。

来自主题: AI资讯
9227 点击    2026-04-05 14:27
一切模态皆Code!实测智谱GLM新模型!视觉编程超亮眼:一张马斯克X头像生成一个3D手办,连苹果官网的动效也学会了!为龙虾而生!

一切模态皆Code!实测智谱GLM新模型!视觉编程超亮眼:一张马斯克X头像生成一个3D手办,连苹果官网的动效也学会了!为龙虾而生!

一切模态皆Code!实测智谱GLM新模型!视觉编程超亮眼:一张马斯克X头像生成一个3D手办,连苹果官网的动效也学会了!为龙虾而生!

今天,智谱正式发布 GLM-5V-Turbo。 看名字就知道,这次智谱新模型,视觉能力大大加强了!话不多说,这次小编直接开测,边测边为大家说一下对 GLM-5V-Turbo 的使用感受。

来自主题: AI产品测评
8384 点击    2026-04-02 16:31
全解读|智谱 GLM-5V-Turbo 发布,多模态 Coding 基模

全解读|智谱 GLM-5V-Turbo 发布,多模态 Coding 基模

全解读|智谱 GLM-5V-Turbo 发布,多模态 Coding 基模

今天,智谱发布 GLM-5V-Turbo,定位「面向视觉编程的多模态 Coding 基座模型」。一句话概括:在 GLM-5-Turbo 的编程和龙虾能力基座上,加入了原生的视觉理解和推理能力

来自主题: AI资讯
7824 点击    2026-04-02 10:43