一种基于多模态大模型的端到端交通道路状态感知方法

申请号：CN202510017064

申请日期：2025-01-06

公开号：CN119964101A

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的端到端交通道路状态感知方法，包括：采集交通视频数据集和交通文本数据集；提取至少部分交通视频数据的每帧图像并特征提取得到交通特征；基于交通要素集对每帧图像进行标注；对交通文本数据集进行清洗、分词和标记化；统计第一比值和第二比值，从而计算联合概率；基于联合概率判断交通要素和交通特征是否关联；基于关联的交通要素和交通特征，利用滑动窗口对清洗后的交通文本数据集进行提取，得到训练样本；对大语言模型进行预训练，得到预训练大语言模型；对感知大模型进行训练；将待输入视频图像输入至训练后的感知大模型中得到场景理解文本。本发明同时实现精准目标检测和路网状态的文本描述。

技术关键词

交通视频数据状态感知方法交通道路交通特征大语言模型多模态文本图像编码器滑动窗口表达式词语分词网络结构场景优化器批量