一种基于多模态大模型的路侧事件理解方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态大模型的路侧事件理解方法
申请号:CN202510415272
申请日期:2025-04-03
公开号:CN120526400A
公开日期:2025-08-22
类型:发明专利
摘要
本发明提出一种基于多模态大模型的路侧事件理解方法,该方法包括获取实时交通场景图像;基于实时交通场景图像和系统指令利用多模态大模型获得关键区域;基于关键区域和实时交通场景图像利用视觉识别模型生成视觉提示信息,视觉识别模型包括开放世界目标检测模块和地图拓扑结构理解模块;基于实时交通场景图像、系统指令、视觉提示信息利用多模态大模型生成路侧事件信息。利用本发明的方法能够提升路侧事件理解的准确性。
技术关键词
交通场景图像 多模态 计算机执行指令 视觉 图像编码器 车道 图像特征提取 理解系统 文本编码器 多层注意力机制 地图 拓扑结构信息 模块 图像获取装置 采样器 可读存储介质 元素