一种基于多模态大模型的路侧事件理解方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于多模态大模型的路侧事件理解方法
申请号:
CN202510415272
申请日期:
2025-04-03
公开号:
CN120526400A
公开日期:
2025-08-22
类型:
发明专利
摘要
本发明提出一种基于多模态大模型的路侧事件理解方法,该方法包括获取实时交通场景图像;基于实时交通场景图像和系统指令利用多模态大模型获得关键区域;基于关键区域和实时交通场景图像利用视觉识别模型生成视觉提示信息,视觉识别模型包括开放世界目标检测模块和地图拓扑结构理解模块;基于实时交通场景图像、系统指令、视觉提示信息利用多模态大模型生成路侧事件信息。利用本发明的方法能够提升路侧事件理解的准确性。
技术关键词
交通场景图像
多模态
计算机执行指令
视觉
图像编码器
车道
图像特征提取
理解系统
文本编码器
多层注意力机制
地图
拓扑结构信息
模块
图像获取装置
采样器
可读存储介质
元素