一种基于图文多模态的道路灾害检测与分层识别方法

申请号：CN202511056410

申请日期：2025-07-30

公开号：CN120953935A

公开日期：2025-11-14

类型：发明专利

摘要

本发明提供一种基于图文多模态的道路灾害检测与分层识别方法，涉及智能交通监测技术领域，方法包括：构建分层文本描述集合，第一层用于交通场景分类并排除非交通干扰画面，第二层用于道路灾害分类且包含负样本提示词；通过文本编码器离线生成文本特征向量并存储至向量数据库；将多模态大模型视觉模块拆分为独立视觉编码器，经ONNX转换部署至边缘设备；实时获取交通图像关键帧，通过视觉编码器提取特征向量，先与第一层文本特征进行余弦相似度匹配，通过筛选后与第二层灾害特征匹配，经softmax归一化和Argmax排序输出分类结果。本发明通过分层语义过滤解决复杂场景识别率低问题，利用模型轻量化拆分实现边缘部署，结合负样本设计提升异常环境下的判别鲁棒性。

技术关键词

分层识别方法文本特征向量多模态图文图像特征向量智能交通监测技术文本编码器场景分类关键帧夜间灯光火灾场景视觉样本画面格式

系统为您推荐了相关专利信息

一种特高压变电站空天地多尺度重决策目标检测方法

特高压变电站跨模态多尺度图像地面巡检机器人

基于级联知识统一模块的多模态遥感图像分割方法及系统

遥感图像分割方法融合特征影像级联生成遥感图像

复杂生态系统中关键物种种群空间分布量化方法及系统

生态系统识别时间序列密度网格多模态特征

一种基于脑电-行为多模态信号反馈调控的视觉认知训练方法

认知训练方法脑电信号特征脑电信号采集设备视觉多模态

一种基于知识图谱的电力服务语义识别方法及系统

语义识别方法图谱电力安监风险因子