基于AI大模型的跨语言语音翻译方法、装置以及设备

申请号：CN202411958846

申请日期：2024-12-30

公开号：CN119378571B

公开日期：2025-04-18

类型：发明专利

摘要

本发明提供了一种基于AI大模型的跨语言语音翻译方法、装置以及设备，包括：对跨语言语音数据进行分帧以及频谱分析，得到频谱序列；将所述频谱序列输入预先训练完成的AI大模型中；基于特征捕捉路径，通过胶囊网络对所述频谱序列中不同频段的频谱特征进行向量封装，得到封装特征；基于全局关联路径，通过图神经网络将所述频谱序列中的各频谱特征构建为图结构，挖掘出各频谱特征之间的全局语义关联特征；对所述不同频段的频谱特征对应的封装特征进行加权融合，得到融合封装特征，将融合封装特征与所述全局语义关联特征进行聚合，得到聚合特征；基于所述聚合特征，翻译得到目标语言的语音数据。在本发明中，提高了跨语言翻译的准确性。

技术关键词

频谱特征语音翻译方法胶囊网络语义序列密钥生成器频段混沌系统节点多层感知机语音翻译装置数据映射算法封装单元符号非线性分析单元处理器