摘要
本发明涉及医疗健康技术领域,具体地说,涉及一种基于多模态医疗数据的智能分析系统,包括多模态特征提取模块,用于从医学图像和文本报告中提取局部和全局特征;跨模态对齐模块,用于通过变分自编码器和解耦表征方法对图像和文本模态的潜在表示进行对齐;以及跨模态交互与融合模块,用于通过多头注意力机制和语义引导机制对模态特征进行交互与融合,生成共享的多模态表示。本发明能够有效整合医学图像和报告文本的互补信息,同时确保模态内信息的完整性,同时通过多个创新模块的设计与优化,该框架在医学报告分析跨模态中展现出优异性能,为复杂医学图像与文本报告分析提供了一种高效而鲁棒的解决方法。