AI资讯新闻榜单内容搜索-自动驾驶

一个模型统一4D世界生成与重建，港科大One4D框架来了

近年来，视频扩散模型在 “真实感、动态性、可控性” 上进展飞快，但它们大多仍停留在纯 RGB 空间。模型能生成好看的视频，却缺少对三维几何的显式建模。这让许多世界模型（world model）导向的应用（空间推理、具身智能、机器人、自动驾驶仿真等）难以落地，因为这些任务不仅需要像素，还需要完整地模拟 4D 世界。

来自主题: AI技术研报

9142 点击 2026-01-13 16:13

AAAI 2026 | 小鹏联合北大，专为VLA模型定制视觉token剪枝方法，让端到端自动驾驶更高效

VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而，VLA 模型中冗长的视觉 token 极大地增加了计算成本。但现有的视觉 token 剪枝方法都不是专为自动驾驶设计的，在自动驾驶场景中都具有局限性。

来自主题: AI技术研报

9822 点击 2026-01-04 15:22

黄仁勋「收购式」抢人继续：20多亿美金“买走”Mobileye创始人AI新团队

财大气粗的老黄，又要出手了！为了将200多位顶尖AI人才纳入麾下，英伟达被曝拟用20~30亿美金收购一家以色列AI初创公司。这家公司名为AI21 Labs，是以色列为数不多的自主研发大语言模型的公司，其联创还曾创办了明星自动驾驶公司Mobileye（Mobileye被收购后成了英特尔副总裁）。

来自主题: AI资讯

10644 点击 2025-12-31 15:15

全景视觉的Depth Anything来了！Insta360推出DAP，200万数据打造全场景360°空间智能新高度

在空间智能（Spatial Intelligence）飞速发展的今天，全景视角因其 360° 的环绕覆盖能力，成为了机器人导航、自动驾驶及虚拟现实的核心基石。然而，全景深度估计长期面临 “数据荒” 与 “模型泛化差” 的瓶颈。

来自主题: AI技术研报

7448 点击 2025-12-30 09:57

Deep Optica这家公司，让「AI 淘金」有了新的意义！

世界模型的场景，不止在自动驾驶方面。极客公园近期接触到的 Deep Optica，刚刚完成由 BV 百度风投、零以创投参与的种子轮融资，正试图从「判断方式」本身入手，为这一高度不确定的过程提供一种更加结构化的路径。

来自主题: AI资讯

10012 点击 2025-12-29 22:21

12毫秒暴露自动驾驶致命缺陷，北航新研究实现场景感知的动态物理对抗攻击｜TPAMI2025

近日，部分L3级自动驾驶车型已经通过工信部批准正式上路，这标志着这我国自动驾驶产业的新阶段。

来自主题: AI技术研报

7693 点击 2025-12-29 09:04

1200行提示泄露！谷歌无人车里的Gemini，活得比打工人还憋屈

1200行泄露代码揭开真相：在Waymo的自动驾驶铁盒子里，无所不能的Gemini不仅被禁止碰方向盘，还被迫变成了一个会讲冷笑话的卑微陪聊。

来自主题: AI资讯

8802 点击 2025-12-27 10:58

刷榜自动驾驶语义场景补全！北大新作：高维度、高密度 | AAAI'26

北京大学团队提出了一种新的视觉语义场景补全方法HD²-SSC，用于从多视角图像重建三维语义场景。该方法通过高维度语义解耦和高密度占用优化，解决了现有技术中二维输入与三维输出之间的维度差异，以及人工标注与真实场景密度差异的问题，从而实现更准确的语义场景补全。

来自主题: AI技术研报

7017 点击 2025-12-18 09:14

仿真数据也能Scaling！虚实结合训练，端到端性能全面提升｜中科院x港大x小米汽车

自动驾驶数据荒怎么破？

来自主题: AI技术研报

8110 点击 2025-12-11 10:10

Percept-WAM：真正「看懂世界」的自动驾驶大脑，感知到行动的一体化模型

近日，来自引望智能与复旦大学的研究团队联合提出了一个面向自动驾驶的新一代大模型 ——Percept-WAM（Perception-Enhanced World–Awareness–Action Model）。该模型旨在在一个统一的大模型中，将「看见世界（Perception）」「理解世界（World–Awareness）」和「驱动车辆行动（Action）」真正打通，形成一条从感知到决策的完整链路。

来自主题: AI技术研报

7516 点击 2025-12-10 14:33