一种低成本的多模态文章生成方法

申请号：CN202510222630

申请日期：2025-02-27

公开号：CN120144739A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开了一种低成本的多模态文章生成方法，包括：获取用户输入数据，为目标文本数据，或，为目标文本数据和目标图像数据；将目标文本数据输入至经过Lora微调的Stable Diffusion‑XL模型中，生成m张图像数据；将m张图像数据进行融合，或，将目标图像数据与m张图像数据进行融合，生成融合特征；将目标文本数据、融合特征分别和m张图像数据输入至训练并优化好的High‑class corpus生成模型中，输出对应的m条目标语料；将m条目标语料和目标文本数据输入至本地的WriterLLM模块中，生成多模态文章。通过该方法，可通过本地小参数LLM扩充图像模态的信息量，并输出高质量预料。

技术关键词

文章生成方法融合特征多张图像数据视觉特征提取文本低成本注意力条目模块多模态关键字编码器策略解码器参数矩阵