图像布局处理方法、计算机程序产品及介质

申请号：CN202411053135

申请日期：2024-08-01

公开号：CN118982603A

公开日期：2024-11-19

类型：发明专利

摘要

本申请公开了一种图像布局处理方法，包括：获取背景图像，将背景图像述输入到视觉表示模块中进行图像处理和特征提取，得到第一视觉特征序列；获取将要在背景图像中进行布局显示的布局信息，将布局信息输入到布局信息表示模块中进行编码，得到第一布局特征序列；将第一视觉特征序列和第一布局特征序列输入到多模态融合模块中进行融合，得到多模态条件控制序列；将多模态条件控制序列作为控制条件输入到条件去噪模型，通过多轮去噪处理，得到布局信息在背景图像中的布局位置。该方法能够提高将文字等信息布局在图像中的设计和处理效率。

技术关键词

布局特征视觉特征变换编码器去噪模型序列交叉注意力机制多模态图像处理坐标元素计算机程序产品模块可读存储介质语义