摘要
本发明公开了一种基于可信视位素获取的中文唇语识别方法,所述方法包括以下步骤:S1.数据采集与预处理:以获得刻画唇部运动视频数据;S2.深度聚类:对刻画唇部运动视频数据进行深度聚类,获得聚类分布的视位素类别数量,相应的视位素类别及视位素库,从而获得与所述刻画唇部运动视频数据相应的带视位素类别标注的逐帧图像数据;S3.基于视位素中间表示的级联汉字字符序列识别:基于带视位素类别标注的逐帧图像数据进行特征提取,实现以视位素为中间表示的级联汉字字符序列识别。本方法能够降低识别预测的累积误差,提升基于视位素的唇语识别性能,打破基于视位素的唇语识别的准确率瓶颈。