摘要
本公开提供了文本处理模型训练方法、视觉媒体的生成方法、装置和存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于基于人工智能的内容生成等场景。具体实现方案为:获取训练文本生成视觉媒体模型时所使用的样本视觉媒体的第一描述文本,并确定第一描述文本的第一结构化内容,以及对第一结构化内容进行重组得到重组文本,并根据重组文本和第一描述文本,对第一初始模型进行训练,得到第一文本处理模型。由此,构建了第一文本处理模型,使其能够实现对输入文本的有效处理,并且其输出目标文本在描述格式上与用于训练文本生成视觉媒体模型的样本视觉媒体的描述文本相一致。