摘要
本发明公开了一种低成本的多模态文章生成方法,包括:获取用户输入数据,为目标文本数据,或,为目标文本数据和目标图像数据;将目标文本数据输入至经过Lora微调的Stable Diffusion‑XL模型中,生成m张图像数据;将m张图像数据进行融合,或,将目标图像数据与m张图像数据进行融合,生成融合特征;将目标文本数据、融合特征分别和m张图像数据输入至训练并优化好的High‑class corpus生成模型中,输出对应的m条目标语料;将m条目标语料和目标文本数据输入至本地的WriterLLM模块中,生成多模态文章。通过该方法,可通过本地小参数LLM扩充图像模态的信息量,并输出高质量预料。