用于自主驾驶的具有逐代理学习的视觉语言规划(VLP)模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
用于自主驾驶的具有逐代理学习的视觉语言规划(VLP)模型
申请号:CN202411600308
申请日期:2024-11-11
公开号:CN119992487A
公开日期:2025-05-13
类型:发明专利
摘要
用于训练自主驾驶的、以代理为中心的视觉语言规划(VLP)机器学习模型的方法和系统。图像数据从车载摄像机获得,包括关于位于外部环境中的代理的细节。通过图像处理,系统识别环境内的这些代理。然后生成周围环境的鸟瞰图(BEV)表示,封装BEV特征,所述BEV特征包括链接到载具和所识别的代理的时空信息。执行VLP模型开始于首先从BEV中提取逐代理BEV特征,其中逐代理BEV特征与环境中的相应代理相关联。从自然语言文本提示中提取逐代理文本特征。对比学习模型推导出逐代理BEV特征和逐代理文本特征之间的相似性。基于相似性细化BEV特征,并且细化的BEV特征用于各种模型中以生成载具的修改的预测轨迹。
技术关键词
自然语言文本 机器学习模型 自主驾驶系统 文本编码器 图像编码器 规划 轨迹 处理器 数据 视觉 指令 车载摄像机 图像处理 存储器 基础 自行车 模板
系统为您推荐了相关专利信息
酒店房间 图片 大语言模型 计算机可读指令 样本
数字孪生模型 监测控制模块 环境监测数据 预警系统 监测模块
图像嵌入 文本编码器 局部图像特征 排序损失 注意力
风险评估模型 机器学习模型 抗干扰传感器 异常状态 物理
多智能家居 图像识别算法 机器学习模型 身份 随机森林