摘要
本公开提出一种交互图像生成模型、交互图像的生成方法、装置及设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,应用于人工智能生成内容AIGC等场景。提出交互图像生成模型,包括物体特征处理网络、结构关系处理网络、手部结构特征处理网络、手部复原网络、物体复原网络及解码器。交互图像生成模型对包含目标物体的图像进行处理,得到目标物体外观特征;将参考关系图与外观特征进行融合,输出交互特征;将手部结构特征处理网络输出的手部结构特征、交互特征及已生成的手部纹理特征进行融合,得到第一特征图;将第一特征图及已生成的物体纹理特征进行融合,得到待解码的第二特征图;对第二特征图进行解码,生成交互图。