一种基于多模态融合的大语言模型冠状动脉CTA影像分析方法
申请号:CN202510081910
申请日期:2025-01-20
公开号:CN119941698A
公开日期:2025-05-06
类型:发明专利
摘要
一种基于多模态融合的大语言模型冠状动脉CTA影像分析方法,涉及大语言模型技术领域,通过构建视觉编码器和桥接模块将图像特征信息提取,再通过一个简单的线性投影层将视觉图像特征向量映射成与大语言模型嵌入空间维度相同的视觉特征向量,这不仅能够将视觉特征信息和文本特征信息对齐,还能提高冠脉CTA图像信息报告生成的准确性和效率,降低假阳率。增强模型对医学图像的理解和分析能力,提升模型在面对复杂医学问题时的响应能力,并有效减缓医生压力和医患沟通成本。
技术关键词
影像分析方法
卷积模块
残差模块
多头注意力机制
桥接模块
特征提取模块
多模态
压缩特征
空洞
图像特征信息提取
基础
分支
视觉特征信息
图像特征向量
大语言模型
医学