一种基于多模态注意力机制的医学影像自监督诊断方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态注意力机制的医学影像自监督诊断方法
申请号:CN202511063432
申请日期:2025-07-31
公开号:CN120876444A
公开日期:2025-10-31
类型:发明专利
摘要
本发明提出一种基于多模态注意力机制的医学影像自监督诊断方法,该方法包括:对原始多模态医学影像依次进行数据标准化、配准对齐与切片处理,得到二维切片图像集合,将二维切片图像分别经过MAE自监督学习与DINO自监督学习,以得到各模态预训练编码器,将二维切片图像依次经过各模态预训练编码器与注意力机制优化处理,以得到融合特征表示,并通过任务特定的解码器处理,以得到最终的诊断结果。本发明结合MAE和DINO两种自监督学习方法,通过随机遮挡图像部分区域并训练模型重建缺失部分,以及对比不同增强视图之间相似度进行自蒸馏训练,有效提取出具有判别性的全局和局部特征,提高了模型的学习效果。
技术关键词
多模态注意力 多模态医学影像 切片 融合特征 图像块 诊断方法 解码器 编码器 注意力机制 图像分割 模态特征 像素 多层感知机 图像重建 矩阵 序列
系统为您推荐了相关专利信息
卷积模块 训练数据处理 融合特征 Winograd算法 特征提取模块
模型预训练 切片 图文 分辨率 视觉
视觉特征编码 生理 心理 融合特征 环境感知数据
混合深度学习模型 长短期记忆网络 噪声 多尺度特征提取 回归预测方法
荔枝树 数字化重构方法 点云地图 采集设备 对象识别