语音障碍检测方法、装置、设备及可读存储介质

申请号：CN202510774231

申请日期：2025-06-11

公开号：CN120318639A

公开日期：2025-07-15

类型：发明专利

摘要

本公开涉及一种语音障碍检测方法、装置、设备及可读存储介质。通过获取标准视听材料，响应于待测对象针对标准视听材料的发音操作，采集多模态发音数据，基于所述发音音频提取音频声学特征，基于所述面部及口腔活动的视频提取视频视觉特征，将所述音频声学特征、所述视频视觉特征以及所述人口学信息编码数据进行多模态特征融合，得到融合特征向量，基于所述融合特征向量以及预训练的预测模型，得到待测对象的语音障碍检测结果。相较于现有技术，本公开实施例通过多模态特征融合，可以提高语音障碍检测的准确性和全面性，提高诊断效率，减少对专业人员的依赖，降低医疗资源的负担，明确发音问题的具体类型，为后续的个性化干预治疗提供科学依据。

技术关键词

待测对象声学特征多模态特征融合视觉特征分类预测模型发音障碍检测方法音频视频语音面部表情特征唇形特征视听障碍检测装置编码向量声音采集设备面部表情识别

系统为您推荐了相关专利信息

基于多模态特征的证件伪装检测方法、装置、介质及设备

证件图像伪装检测方法光学字符识别多模态特征视觉特征提取

一种语音情感模型的训练方法、识别方法及装置

声学特征情感类别分支音频特征数据

电力设施智能锁远程控制与权限管理系统

智能锁设备权限管理系统电力设施智能锁模块权限管理模块

入睡监测方法、装置和睡眠监测设备

阵列睡眠监测设备融合特征监测方法分类预测模型

一种品牌形象创意设计系统

协同设计平台符号特征知识图谱构建管控系统多模态