一种基于图文多模态的道路灾害检测与分层识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于图文多模态的道路灾害检测与分层识别方法
申请号:CN202511056410
申请日期:2025-07-30
公开号:CN120953935A
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供一种基于图文多模态的道路灾害检测与分层识别方法,涉及智能交通监测技术领域,方法包括:构建分层文本描述集合,第一层用于交通场景分类并排除非交通干扰画面,第二层用于道路灾害分类且包含负样本提示词;通过文本编码器离线生成文本特征向量并存储至向量数据库;将多模态大模型视觉模块拆分为独立视觉编码器,经ONNX转换部署至边缘设备;实时获取交通图像关键帧,通过视觉编码器提取特征向量,先与第一层文本特征进行余弦相似度匹配,通过筛选后与第二层灾害特征匹配,经softmax归一化和Argmax排序输出分类结果。本发明通过分层语义过滤解决复杂场景识别率低问题,利用模型轻量化拆分实现边缘部署,结合负样本设计提升异常环境下的判别鲁棒性。
技术关键词
分层识别方法 文本特征向量 多模态 图文 图像特征向量 智能交通监测技术 文本编码器 场景分类 关键帧 夜间灯光 火灾场景 视觉 样本 画面 格式
系统为您推荐了相关专利信息
特高压变电站 跨模态 多尺度 图像 地面巡检机器人
遥感图像分割方法 融合特征 影像 级联 生成遥感图像
生态系统 识别时间序列 密度 网格 多模态特征
认知训练方法 脑电信号特征 脑电信号采集设备 视觉 多模态
语义识别方法 图谱 电力安监 风险 因子