融合手势标注的编辑式非自回归手语翻译方法及装置

申请号：CN202511018520

申请日期：2025-07-23

公开号：CN120823649A

公开日期：2025-10-21

类型：发明专利

摘要

本发明提出了一种融合手势标注的编辑式非自回归手语翻译方法及装置，其中该方法包括：获取视觉特征序列、对应的手势标注和译文，以生成训练数据集；构建神经网络模型，将训练数据集输入到神经网络模型进行训练，以得到训练好的非自回归手语翻译模型，其中，在训练过程中采用以译文为中心和以手势标注为中心的双中心学习策略以及采用关键帧手势标注替换方式引入噪声进行训练；获取待翻译的视觉特征序列，并将其输入到训练好的非自回归手语翻译模型进行手势标注预测、文本删除和文本插入，以得到翻译结果；由此，通过将手势标注作为编辑生成译文的初始序列，使模型能够在保持非自回归模型推理速度优势的同时，显著提升翻译性能。

技术关键词

神经网络模型手势手语翻译方法视觉特征手语翻译装置序列关键帧翻译模型生成训练数据文本噪声编辑分类器时序生成译文重构解码编码器模块

系统为您推荐了相关专利信息

彩釉玻璃钢化加热段温度梯度控制方法、装置、设备和介质

彩釉玻璃玻璃热膨胀系数玻璃粉平均热膨胀系数色粉

动态自然声音模拟的睡眠辅助系统及方法

睡眠辅助方法生理深度睡眠状态睡眠辅助系统调控策略

基于视觉图像的食物含水量计算方法、装置、设备及介质

视觉特征图像特征检测方法特征值信息增益算法

电池绝缘失效检测方法、装置、终端及存储介质

失效检测方法绝缘图谱因子电压

测天文光红移的标准数据集和基线模型的构建方法和系统

贝叶斯神经网络基线小区间样本神经网络模型训练