一种结合声调信息的中文唇语识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种结合声调信息的中文唇语识别方法
申请号:CN202411872081
申请日期:2024-12-18
公开号:CN119810914B
公开日期:2025-10-24
类型:发明专利
摘要
本发明公开了一种结合声调信息的中文唇语识别方法,属于唇语识别领域,该方法包括以下步骤:获取用户输入,其中,所述用户输入包括声调信息和嘴部动作视频;对所述用户输入进行预处理得到预处理数据;构建多模态中文唇读模型,将所述预处理数据输入所述多模态中文唇读模型得到唇语识别结果。本发明结合声调信息与唇读识别技术,通过深入分析视觉信息并结合语言学知识,构建包含声调信息的唇读识别模型,提高识别准确性。
技术关键词
中文唇语识别方法 视频特征向量 唇读模型 多模态 头戴显示器 子模块 唇语识别系统 卷积特征 手持控制器 触控板 数据 关键点 轨迹 图像 视频帧 解码器 标签 坐标