语音障碍检测方法、装置、设备及可读存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音障碍检测方法、装置、设备及可读存储介质
申请号:CN202510774231
申请日期:2025-06-11
公开号:CN120318639A
公开日期:2025-07-15
类型:发明专利
摘要
本公开涉及一种语音障碍检测方法、装置、设备及可读存储介质。通过获取标准视听材料,响应于待测对象针对标准视听材料的发音操作,采集多模态发音数据,基于所述发音音频提取音频声学特征,基于所述面部及口腔活动的视频提取视频视觉特征,将所述音频声学特征、所述视频视觉特征以及所述人口学信息编码数据进行多模态特征融合,得到融合特征向量,基于所述融合特征向量以及预训练的预测模型,得到待测对象的语音障碍检测结果。相较于现有技术,本公开实施例通过多模态特征融合,可以提高语音障碍检测的准确性和全面性,提高诊断效率,减少对专业人员的依赖,降低医疗资源的负担,明确发音问题的具体类型,为后续的个性化干预治疗提供科学依据。
技术关键词
待测对象 声学特征 多模态特征融合 视觉特征 分类预测模型 发音 障碍检测方法 音频 视频 语音 面部表情特征 唇形特征 视听 障碍检测装置 编码向量 声音采集设备 面部表情识别
系统为您推荐了相关专利信息
证件图像 伪装检测方法 光学字符识别 多模态特征 视觉特征提取
声学特征 情感类别 分支 音频特征 数据
智能锁设备 权限管理系统 电力设施 智能锁模块 权限管理模块
阵列 睡眠监测设备 融合特征 监测方法 分类预测模型
协同设计平台 符号特征 知识图谱构建 管控系统 多模态