一种结合深度学习算法与大语言模型的道路交叉口感知与场景理解方法

申请号：CN202510850407

申请日期：2025-06-24

公开号：CN120747881A

公开日期：2025-10-03

类型：发明专利

摘要

本申请属于智能交通技术领域，具体而言涉及一种结合深度学习算法与大语言模型的道路交叉口感知与场景理解方法，包括：获取交通视觉数据；基于交通视觉数据进行深度学习目标检测，得到与交通视觉数据中对应的对象，同时记录相关的动态信息，形成提示标签；基于交叉口某一个视角的交通监控图像和提示标签，经过大语言模型的处理得到交叉口对应视角的场景描述；基于交叉口单视角场景描述和提示标签，增强链式思维微调大语言模型以得到整个交叉口的交通场景理解和语义描述。

技术关键词

场景理解方法道路交叉口深度学习算法大语言模型交通监控图像注意力融合特征推理规则多视角焦点损失函数标签线性变换矩阵视觉智能交通技术分支解码器