摘要
本申请提供一种语音识别模型训练方法及版画生成方法、版画生成系统,涉及金融科技领域或其他相关领域。语音识别模型训练方法包括:通过正交分解提取样本音频数据中的纯净图片内容描述信息和纯净情感倾向信息,样本音频数据用于生成图片,纯净图片内容描述信息描述样本音频数据对应的图片的图像内容,纯净情感倾向信息描述样本音频数据对应的图片的情感倾向;根据纯净图片内容描述信息、纯净情感倾向信息,通过损失函数计算损失值,并根据损失值更新语音识别模型的权重参数。通过正交分解,语音识别模型可以将音频信号分解为内容相关和情感相关的特征,从而在生成图片时更好地结合这些信息,使生成的风格图片可以满足用户需求。