模型训练方法、数据处理方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型训练方法、数据处理方法、装置、设备及存储介质
申请号:CN202410830602
申请日期:2024-06-25
公开号:CN118606896A
公开日期:2024-09-06
类型:发明专利
摘要
本发明公开了一种多模态数据处理模型的训练方法,包括:获取第一训练样本数据集,所述第一训练样本数据集由若干音频数据组成;通过所述第一训练样本数据集训练第一数据处理模型,获得预训练的第一数据处理模型;获取第二训练样本数据集,所述第二训练样本数据集包括:音频数据、文本数据、音频与文本混合数据;基于所述预训练的第一数据处理模型构建所述多模态数据处理模型,通过所述第二训练样本数据集对所述多模态数据处理模型进行端到端的训练,获得目标多模态数据处理模型。通过应用本方案,可以实现端到端的多模态数据处理模型的训练,避免现有技术中通过多个独立模块组合成的模型在处理数据过程中错误累积的问题。
技术关键词
数据处理模型 训练样本数据 多模态 音频 解码单元 特征提取模型 标识符 生成样本数据 特征提取器 文本 数据处理方法 嵌入特征 数据处理装置 编码 声学特征 语义特征 模型训练方法 数据处理单元