一种结合深度学习算法与大语言模型的道路交叉口感知与场景理解方法
申请号:CN202510850407
申请日期:2025-06-24
公开号:CN120747881A
公开日期:2025-10-03
类型:发明专利
摘要
本申请属于智能交通技术领域,具体而言涉及一种结合深度学习算法与大语言模型的道路交叉口感知与场景理解方法,包括:获取交通视觉数据;基于交通视觉数据进行深度学习目标检测,得到与交通视觉数据中对应的对象,同时记录相关的动态信息,形成提示标签;基于交叉口某一个视角的交通监控图像和提示标签,经过大语言模型的处理得到交叉口对应视角的场景描述;基于交叉口单视角场景描述和提示标签,增强链式思维微调大语言模型以得到整个交叉口的交通场景理解和语义描述。
技术关键词
场景理解方法
道路交叉口
深度学习算法
大语言模型
交通监控图像
注意力
融合特征
推理规则
多视角
焦点损失函数
标签
线性变换矩阵
视觉
智能交通技术
分支
解码器