摘要
本申请公开了一种图像布局处理方法,包括:获取背景图像,将背景图像述输入到视觉表示模块中进行图像处理和特征提取,得到第一视觉特征序列;获取将要在背景图像中进行布局显示的布局信息,将布局信息输入到布局信息表示模块中进行编码,得到第一布局特征序列;将第一视觉特征序列和第一布局特征序列输入到多模态融合模块中进行融合,得到多模态条件控制序列;将多模态条件控制序列作为控制条件输入到条件去噪模型,通过多轮去噪处理,得到布局信息在背景图像中的布局位置。该方法能够提高将文字等信息布局在图像中的设计和处理效率。