语音识别模型训练方法及版画生成方法、版画生成系统

申请号：CN202411973684

申请日期：2024-12-30

公开号：CN119811374A

公开日期：2025-04-11

类型：发明专利

摘要

本申请提供一种语音识别模型训练方法及版画生成方法、版画生成系统，涉及金融科技领域或其他相关领域。语音识别模型训练方法包括：通过正交分解提取样本音频数据中的纯净图片内容描述信息和纯净情感倾向信息，样本音频数据用于生成图片，纯净图片内容描述信息描述样本音频数据对应的图片的图像内容，纯净情感倾向信息描述样本音频数据对应的图片的情感倾向；根据纯净图片内容描述信息、纯净情感倾向信息，通过损失函数计算损失值，并根据损失值更新语音识别模型的权重参数。通过正交分解，语音识别模型可以将音频信号分解为内容相关和情感相关的特征，从而在生成图片时更好地结合这些信息，使生成的风格图片可以满足用户需求。

技术关键词

语音识别模型图像内容特征图片版画计算机执行指令生成方法样本数据风格生成系统音频信号分解语音识别模块可读存储介质参数计算机程序产品处理器训练装置