基于多模态去噪扩散模型的异常检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态去噪扩散模型的异常检测方法
申请号:CN202511146329
申请日期:2025-08-15
公开号:CN121010868A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了基于多模态去噪扩散模型的异常检测方法,属于异常检测技术领域。针对现有异常检测方法在工业质量检查中易受单模态信息局限性和特征依赖关系建模不足的影响,导致异常重建效果不佳问题,首先构建多模态大语言模型与CLIP编码器,联合生成异常语义描述,将文本模态提示嵌入去噪扩散过程;其次,设计具有四阶段层级结构的去噪UNet网络,每个阶段集成混合注意力增强Transformer模块,通过将通道级自注意力与像素注意力机制进行穿行连接,在空间和通道维度上同步捕获长程依赖关系并强化局部细节;最后通过跨模态特征对齐实现异常区域的精确重建。实验表明,本方法提升了异常图像的重建质量和异常检测的精度,在复杂的工业场景中具有较强的鲁棒性。
技术关键词
异常检测方法 多模态 深度网络模型 编码器 交叉注意力机制 图像 大语言模型 通道 模块 文本 解码器结构 噪声 缩放参数 分层 异常检测技术 阶段 像素 矩阵