基于视觉语言的自动驾驶方法、设备及介质

申请号：CN202510600345

申请日期：2025-05-09

公开号：CN120397003A

公开日期：2025-08-01

类型：发明专利

摘要

本申请提供一种基于视觉语言的自动驾驶方法、设备及介质，涉及自动驾驶技术领域。该方法包括：获取导航地图输入的导航指令以及多视角传感器采集到的多视图图像数据；根据预设的轨迹规划模型中的视觉语言模型以及导航指令和多视图图像数据，得到视觉语言向量；根据轨迹规划模型中的端到端模型、导航指令、多视图图像数据以及视觉语言向量，得到车辆的规划轨迹；确定规划轨迹对应的控制信号，并根据控制信号进行自动驾驶。本申请的方法，简化了自动驾驶过程中轨迹预测的处理流程，降低了计算量消耗，且能处理复杂的路况，提高了自动驾驶的场景覆盖度。

技术关键词

自动驾驶方法视觉计算机执行指令令牌轨迹规划图像文本特征向量数据文本编码器场景标签多视角神经网络模型样本自动驾驶技术可读存储介质车辆

系统为您推荐了相关专利信息

基于鸡冠形态的蛋鸡健康状况监测方法及系统

健康状况监测方法图像蛋鸡序列形态

一种基于两级任务分配算法的无人机任务执行方法及系统

任务分配方法任务分配算法匈牙利匹配算法载荷规划

基于机器视觉的木耳采收机器人

直线驱动装置木耳菌袋旋转驱动机构抓取机构螺旋传动装置

可解释性事故责任判定方法及系统

判定方法时序神经网络生成规则长短期记忆网络定位轨迹数据

非平面结构件的焊缝识别方法、介质及设备

方程焊缝识别方法端点点云直线