图像描述生成方法、装置、电子设备及存储介质

申请号：CN202511062755

申请日期：2025-07-30

公开号：CN120913207A

公开日期：2025-11-07

类型：发明专利

摘要

本申请实施例提供了一种图像描述生成方法、装置、电子设备及存储介质，属于人工智能技术领域，适用于金融科技领域和数字医疗领域。该方法包括：检测样本图像中目标对象的对象位置、对象类别和对象视觉特征；识别原始图像描述的描述关键词和描述关键词的语义特征；根据对象位置、对象类别、对象视觉特征、描述关键词和语义特征，生成图结构数据，图结构数据包括图节点和连接边，连接边具有边权重；根据边权重构建邻接矩阵；通过图神经网络对图节点和邻接矩阵进行特征提取，得到目标融合特征；根据原始图像描述、邻接矩阵和目标融合特征更新图神经网络；通过更新得到的图像描述生成模型对目标图像进行图像描述生成，能够提高图像描述生成的准确性。

技术关键词

融合特征节点特征关键词视觉特征语义特征对象注意力生成方法网络样本拉普拉斯电子设备图像编码器可读存储介质矩阵邻居特征提取模块人工智能技术

系统为您推荐了相关专利信息

基于多视角特征融合与碰撞风险分析的智能汽车换道方法

多视角特征融合换道方法智能汽车车辆方差贡献率

一种基于多模态的合同问答方法

问答方法多模态问答系统数据决策

一种面向应急救援场景的可伸缩跨模态触觉信号生成方法

面向应急救援信号生成方法跨模态音频特征融合特征

图像去马赛克方法及系统

图像去马赛克方法深度神经网络融合特征图像传感器颜色

一种基于AI的自适应服装设计动画建模方法及系统

模特模型动画建模方法款式关键词样式