基于多模态自适应融合的海关违禁品检测方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态自适应融合的海关违禁品检测方法及系统
申请号:CN202510492962
申请日期:2025-04-18
公开号:CN120411705A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开一种基于多模态自适应融合的海关违禁品检测方法及系统,包括:获取海关通关图像‑文本对,并提取海关通关图像的包括多尺度特征的原始特征,分别对浅层特征和深层特征加权融合后生成浅层融合特征和深层融合特征,对深层融合特征经多尺度池化操作后得到池化特征,将浅层融合特征、深度融合特征和池化特征拼接生成增强特征,将增强特征和原始特征整合后得到视觉特征;将视觉特征与文本特征进行模态对齐,对检测模型进行两阶段训练,由此得到违禁品检测结果。设计自适应动态通道融合模块,从多层隐藏状态中整合浅层细节和深层语义,通过自适应权重优化特征表达,实现低层细节与深层语义的有效融合,提高复杂场景下的特征分辨能力。
技术关键词
违禁品检测方法 融合特征 视觉特征 语言编码器 特征加权融合 池化特征 多尺度特征 答案 文本 违禁品检测系统 多模态特征 图像 两阶段 指令 多尺度池化 计算机 处理器 模板组合