视频手语问答方法、系统、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
视频手语问答方法、系统、设备及存储介质
申请号:CN202511537027
申请日期:2025-10-27
公开号:CN121033944A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种视频手语问答方法、系统、设备及存储介质,它们是一一对应的方案,方案中:手语识别翻译技术利用自监督预训练技术来增强模型的表征能力,实现手语视频翻译并完成训练数据的充分利用,提升识别准确率;并且,利用大语言模型和知识检索技术,在知识库的约束下进行生成式问答,同时通过多次交互理解用户意图、保持上下文,完成复杂任务下的智能对话;此外,手语生成过程中,第一步将文字转化成符合手语语序的gloss,第二步将gloss转化为动作序列并驱动数字人,此步中,使用动作平滑和过渡生成技术对手语词的动作序列进行处理,减少动作的抖动问题,得到更加平滑的动作序列进行数字人驱动。
技术关键词
手语识别翻译 大语言模型 问答方法 预训练模型 序列 答案 视频 生成技术 翻译模型 知识检索技术 数据 三元组 自然语言文本 子系统 问答模型 问答系统 解码器 处理器