基于语音语料对齐与自适应融合的语音分类方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于语音语料对齐与自适应融合的语音分类方法
申请号:CN202411060512
申请日期:2024-08-05
公开号:CN118571216B
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了基于语音语料对齐与自适应融合的语音分类方法,方法包括:构建语音分类数据集,并划分为训练集与测试集;构建语音分类网络模型,包括对齐构造模块、语音关联性构建模块、片段重要性挖掘模块、融合检测模块;将融合检测模块输出特征输入分类器以获得预测结果;设计用于优化网络模型参数的损失函数,根据损失函数在训练集上采用Adam优化器实现模型参数的迭代优化与更新;训练完成的语音分类网络模型可实现对语音信号的端对端分类。本发明利用深度学习技术通过语音信号实现自动分类,可应用于不同场景,如对情感、性别、年龄等特征的识别,有助于企业分析用户的情感、性别、年龄,从而提供更人性化、更具针对性的服务。
技术关键词
语音分类方法 分类网络 数据分类 模块 交互特征 嵌入特征 优化器 分类器 梯度下降算法 对齐工具 深度学习技术 超参数 特征提取器 注意力机制 传播算法 输出特征