用于自主驾驶的具有逐代理学习的视觉语言规划(VLP)模型

申请号：CN202411600308

申请日期：2024-11-11

公开号：CN119992487A

公开日期：2025-05-13

类型：发明专利

摘要

用于训练自主驾驶的、以代理为中心的视觉语言规划(VLP)机器学习模型的方法和系统。图像数据从车载摄像机获得，包括关于位于外部环境中的代理的细节。通过图像处理，系统识别环境内的这些代理。然后生成周围环境的鸟瞰图(BEV)表示，封装BEV特征，所述BEV特征包括链接到载具和所识别的代理的时空信息。执行VLP模型开始于首先从BEV中提取逐代理BEV特征，其中逐代理BEV特征与环境中的相应代理相关联。从自然语言文本提示中提取逐代理文本特征。对比学习模型推导出逐代理BEV特征和逐代理文本特征之间的相似性。基于相似性细化BEV特征，并且细化的BEV特征用于各种模型中以生成载具的修改的预测轨迹。

技术关键词

自然语言文本机器学习模型自主驾驶系统文本编码器图像编码器规划轨迹处理器数据视觉指令车载摄像机图像处理存储器基础自行车模板

系统为您推荐了相关专利信息

酒店房间的检索方法、系统、设备、介质及产品

酒店房间图片大语言模型计算机可读指令样本

一种实验室安全预警系统

数字孪生模型监测控制模块环境监测数据预警系统监测模块

一种文本检索行人重识别的数据增强方法

图像嵌入文本编码器局部图像特征排序损失注意力

一种基于数字化的敏感区域水下爆破安全预警方法与系统

风险评估模型机器学习模型抗干扰传感器异常状态物理

一种多智能家居控制方法及智能遥控器

多智能家居图像识别算法机器学习模型身份随机森林