基于图感知学习的胸部X光片多模态预训练方法及系统

申请号：CN202511438882

申请日期：2025-10-10

公开号：CN120911533A

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及图像处理领域，提出一种基于图感知学习的胸部X光片多模态预训练方法及系统，通过构建多轮问答字典进行数据生成，从疾病分类、分类确定性以及对应病变部位三个层面，生成胸部X光片中各个病变部位的局部描述性文本，并自动生成全局性的描述文本，有效避免了数据不足的问题，并提高了文本描述的质量和一致性，又通过图感知预训练，基于从全局到局部的图感知学习方法，构建局部与全局特征之间的相关性图结构，深度挖掘胸片各部位与疾病之间的跨模态关联性，更准确地捕捉难以识别的微小视觉差异，减少图像与文本之间的模态差异，本发明提高了分析胸部X光片的精准度和泛化能力。

技术关键词

全局视觉特征预训练方法标签大语言模型字典数据跨模态节点图像特征提取文本编码器图像编码器全局信息融合预训练系统图像增强模块计算机设备疾病