一种基于语音识别的对话交互方法及装置

申请号：CN202411494147

申请日期：2024-10-24

公开号：CN119446141A

公开日期：2025-02-14

类型：发明专利

摘要

本申请属于智能交互技术领域，公开了一种基于语音识别的对话交互方法及装置，该方法包括：获取音频数据，并对音频数据进行预处理，得到短时信号；提取短时信号中的音频特征信息；将音频特征信息输入全协方差的高斯混合模型，得到真人可能性评分；若真人可能性评分大于预设阈值，则将音频数据转换为文本数据对文本数据进行意图识别、实体识别和情感识别，得到识别结果；根据识别结果在对应的行业数据库中匹配对答文本；将对答文本转换为语音数据，并播放语音数据。本申请能够捕捉到短时信号的多样性和复杂性，提高音频识别的鲁棒性和准确性，避免对话引擎与非人对话，节省计算资源。

技术关键词

对话交互方法音频特征信息文本语音数据高斯混合模型意图识别重构误差智能交互技术语句信号特征提取模块声学特征处理器交互装置曲线拼音播放模块实体

系统为您推荐了相关专利信息

基于多目标贝叶斯优化的微通道反应器设计方法、装置及存储介质

微通道反应器迭代优化算法仿真分析参数执行化学反应

一种星载计算系统的智能应用在轨安装升级方法及装置

升级方法升级装置数据一致性校验地面系统信息显示设备

时序网络下的家居碳排放监测方法及系统

家居设备碳排放监测方法 LSTM模型环境传感器历史功率数据

面向复杂材质的全局全频光照的神经绘制方法与系统

绘制方法融合特征光照输入解码器缓冲

一种SMI接口读写系统及方法

读写系统芯片模块写请求时钟计数器