摘要
本申请实施例提供了一种图像描述生成方法、装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域和数字医疗领域。该方法包括:检测样本图像中目标对象的对象位置、对象类别和对象视觉特征;识别原始图像描述的描述关键词和描述关键词的语义特征;根据对象位置、对象类别、对象视觉特征、描述关键词和语义特征,生成图结构数据,图结构数据包括图节点和连接边,连接边具有边权重;根据边权重构建邻接矩阵;通过图神经网络对图节点和邻接矩阵进行特征提取,得到目标融合特征;根据原始图像描述、邻接矩阵和目标融合特征更新图神经网络;通过更新得到的图像描述生成模型对目标图像进行图像描述生成,能够提高图像描述生成的准确性。