摘要
本发明公开了基于多模态去噪扩散模型的异常检测方法,属于异常检测技术领域。针对现有异常检测方法在工业质量检查中易受单模态信息局限性和特征依赖关系建模不足的影响,导致异常重建效果不佳问题,首先构建多模态大语言模型与CLIP编码器,联合生成异常语义描述,将文本模态提示嵌入去噪扩散过程;其次,设计具有四阶段层级结构的去噪UNet网络,每个阶段集成混合注意力增强Transformer模块,通过将通道级自注意力与像素注意力机制进行穿行连接,在空间和通道维度上同步捕获长程依赖关系并强化局部细节;最后通过跨模态特征对齐实现异常区域的精确重建。实验表明,本方法提升了异常图像的重建质量和异常检测的精度,在复杂的工业场景中具有较强的鲁棒性。