AI资讯新闻榜单内容搜索-VLA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: VLA
空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作

空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作

空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作

与3D物理环境交互、适应不同机器人形态并执行复杂任务的通用操作策略,一直是机器人领域的长期追求。

来自主题: AI技术研报
5003 点击    2025-03-05 13:46
VLA改写智驾竞速规则,英伟达算力核弹加持,黑马玩家4个月撬走10%份额

VLA改写智驾竞速规则,英伟达算力核弹加持,黑马玩家4个月撬走10%份额

VLA改写智驾竞速规则,英伟达算力核弹加持,黑马玩家4个月撬走10%份额

因为就在岁末年初,一种全新的技术范式正在开启落地,头部玩家有了爆款证明,引领行业跟进对齐,隐隐成为共识趋势……这种技术范式,就是——VLA。

来自主题: AI资讯
4688 点击    2025-01-26 11:49
真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!

真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!

真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!

今天,银河通用机器人发布了端到端具身抓取基础大模型「GraspVLA」,全球第一个预训练完全基于仿真合成大数据的具身大模型,展现出了比OpenVLA、π0、RT-2、RDT等模型更全面强大的泛化性和真实场景实用潜力。

来自主题: AI技术研报
5293 点击    2025-01-10 12:23
全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

近年来,视觉语言基础模型(Vision Language Models, VLMs)大放异彩,在多模态理解和推理上展现出了超强能力。现在,更加酷炫的视觉语言动作模型(Vision-Language-Action Models, VLAs)来了!通过为 VLMs 加上动作预测模块,VLAs 不仅能 “看” 懂和 “说” 清,还能 “动” 起来,为机器人领域开启了新玩法!

来自主题: AI技术研报
6615 点击    2025-01-02 16:29
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

近年来,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。

来自主题: AI技术研报
7616 点击    2024-12-28 11:41
李想谈“理想”最新战略 —— 转型 AI 公司,目标国内大模型 Top3,未来构建统一 VLA 模型,成为你的硅基家人

李想谈“理想”最新战略 —— 转型 AI 公司,目标国内大模型 Top3,未来构建统一 VLA 模型,成为你的硅基家人

李想谈“理想”最新战略 —— 转型 AI 公司,目标国内大模型 Top3,未来构建统一 VLA 模型,成为你的硅基家人

2024 年,理想汽车以突破 100 万辆的累计交付量成为中国智能电动车市场的一大亮点。然而,在这一辉煌背后,理想汽车正迎来一场前所未有的转型。

来自主题: AI资讯
7535 点击    2024-12-26 10:05
开炒VLA,“端到端”过气了?

开炒VLA,“端到端”过气了?

开炒VLA,“端到端”过气了?

2024年,智驾领域最热的词,就是“端到端”。甚至,到了不聊端到端都没法出门的程度。

来自主题: AI资讯
6749 点击    2024-12-20 15:21
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩

首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩

首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩

SOLAMI是一个创新的VR端3D角色扮演AI系统,用户可以通过语音和肢体语言与虚拟角色进行沉浸式互动。该系统利用先进的社交视觉-语言-行为模型,结合合成的数据集,提供更自然的交流体验,超越了传统的文本和语音交互。

来自主题: AI技术研报
8065 点击    2024-12-09 15:14
清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS'24

清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS'24

清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS'24

计算、存储消耗高,机器人使用多模态模型的障碍被解决了! 来自清华大学的研究者们设计了DeeR-VLA框架,一种适用于VLA的“动态推理”框架,能将LLM部分的相关计算、内存开销平均降低4-6倍。

来自主题: AI技术研报
7041 点击    2024-11-30 16:29
详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

近期,智驾行业出现了一个融合了视觉、语言和动作的多模态大模型范式——VLA(Vision-Language-Action Model,即视觉-语言-动作模型),拥有更高的场景推理能力与泛化能力。不少智驾人士都将VLA视为当下“端到端”方案的2.0版本。

来自主题: AI资讯
4131 点击    2024-11-09 09:50