一种基于RGB与骨骼点双通道的独立手语识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于RGB与骨骼点双通道的独立手语识别方法及系统
申请号:CN202510524218
申请日期:2025-04-24
公开号:CN120412025A
公开日期:2025-08-01
类型:发明专利
摘要
一种基于RGB与骨骼点双通道的独立手语识别方法及系统,属于深度学习图像处理及视频识别技术领域。本发明使用采集的手语视频提取骨骼点视频,根据骨骼点视频剔除多余部分,构建了基于RGB和骨骼点双通道的手语识别模型,将手语视频和骨骼点视频输入模型,使用一维卷积提取时间特征,使用二维卷积提取空间特征,将双通道的时间特征、空间特征融合后进行分类识别。双通道输入增强了模型对手语动作的理解,有效减少手语者不同、光照和背景等因素对识别过程的影响,且能通过骨骼点视频判断手势的开始和结束,提升了手语识别的准确性。此外,本发明将三维卷积网络拆分为一维卷积网络和二维卷积网络,降低了模型参数,提升了手语识别的实时性。
技术关键词
手语识别方法 骨骼关键点 手语识别系统 卷积模块 视频采集模块 深度学习图像处理 手势 特征提取单元 识别模块 加权平均法 二维卷积网络 视频识别技术 积层 Adam算法 输入端 图片
系统为您推荐了相关专利信息
注意力机制 输出特征 捕获特征 多尺度特征 推理算法
透光率 信噪比 文本 图像 噪声
告警方法 全景视频图像 配网不停电作业 姿态估计 告警机制
图像检测模型 智能检测方法 污垢 玻璃 边缘检测方法
司机 跨尺度特征融合 人脸特征点检测 眼睛 积层