
3D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32%
3D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32%中科院自动化所提出BridgeVLA模型,通过将3D输入投影为2D图像并利用2D热图进行动作预测,实现了高效且泛化的3D机器人操作学习。
中科院自动化所提出BridgeVLA模型,通过将3D输入投影为2D图像并利用2D热图进行动作预测,实现了高效且泛化的3D机器人操作学习。
ICCV 2025 将于 10 月 19 日至 25 日在美国夏威夷举行。刚刚,ICCV 官方向投稿者发送了今年论文接收结果的通知。
今年的大模型已经「保底985、冲刺清北」了,明年还考吗? 果然,高考已经快被 AI 攻克了。
突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。
就在刚刚,谷歌深夜悄无声息地扔下了一颗重磅炸弹,正式推出了一个全新的开源AI编程工具:Gemini CLI
谷歌把最新的文生图模型 Imagen 4,以及它的 Pro Max 版 Imagen 4 Ultra,放到了 AI Studio 和 API 里。
梵高、蒙娜丽莎、维纳斯、毕加索、草间弥生……这些世界名画的主角和画家们忽然复活,穿上时装走上T台,这个AI视频,已经全网刷爆了!视觉盛宴,泪点拉满,这场穿越时空的艺术秀,让全网震撼。
该研究提出了一种全新的三维牙周病自动诊断系统——PerioAI,实现了对龈骨距离(gingiva-bone distance, GBD)的非侵入式、高精度测量,为牙周病的数字化诊疗提供了全新解决方案。
当下的AI Agent领域,正上演着一幕“奇特”的景象,一方面,是关于Agent能力极限的狂热探讨;但另一方面,是当这些光鲜的Agent从实验室走向真实生产环境时的普遍“失速”与“沉寂”。
AI安全不是加分项,而是AI应用落地的必要一环。