一种基于文本语言提示的术后病理图像分析方法

申请号：CN202511262812

申请日期：2025-09-05

公开号：CN120782767B

公开日期：2025-11-07

类型：发明专利

摘要

本申请涉及一种基于文本语言提示的术后病理图像分析方法，该方法首先通过对病理全切片扫描图像进行切割，分别得到多个第一图像块、多个第二图像块；提取各第一图像块的特征，作为局部图像特征；提取并加权求和所有第二图像块的特征，得到全局图像特征；基于全局图像特征与各局部图像特征之间的余弦相似度，融合局部图像特征得到总体图像特征；将待分析的病理全切片扫描图像输入至视觉‑语言多模态大模型，并对输出的整体视觉特征文本描述进行特征提取，得到文本特征；而后融合总体图像特征与文本特征，得到多模态特征；将多模态特征输入分类器，得到各癌症类型的概率分布。该方法为术后病理分析提供了可解释、可交互、跨模态融合的创新解决方案。

技术关键词

局部图像特征图像分析方法融合特征病理图像特征提取缩略图注意力多模态特征交互特征图像特征向量切片视觉特征文本编码器图像块跨模态热力图