一种基于图像文本对齐的口腔正畸诊断报告自动生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于图像文本对齐的口腔正畸诊断报告自动生成方法
申请号:CN202411568409
申请日期:2024-11-05
公开号:CN119694477B
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了一种基于图像与文本对齐的口腔正畸诊断报告自动生成方法,首先对口腔正畸侧位片进行预处理,使用高斯卷积提取图像特征;与此同时,利用状态空间模型对口腔正畸报告进行建模和特征提取。接着,通过交叉注意力机制对齐图像与文本特征,以便图像特征提取模块更准确地识别与图像相关的语义信息,从而将图像特征与相应的语言描述紧密关联。最终,将提取到的正畸知识特征输入文本解码器,生成高质量的口腔正畸诊断报告。本发明显著提升了诊断报告生成的精度和效率,解决了传统手工诊断过程中存在的低质量和低效率问题。
技术关键词
报告自动生成方法 图像特征提取 高斯金字塔 空间模块 卷积编码器 文本 线性 多层感知机 状态空间模型 sigmoid函数 对齐模块 交叉注意力机制 多尺度 词嵌入向量 矩阵 坐标