摘要
本发明提供了一种基于AI大模型的跨语言语音翻译方法、装置以及设备,包括:对跨语言语音数据进行分帧以及频谱分析,得到频谱序列;将所述频谱序列输入预先训练完成的AI大模型中;基于特征捕捉路径,通过胶囊网络对所述频谱序列中不同频段的频谱特征进行向量封装,得到封装特征;基于全局关联路径,通过图神经网络将所述频谱序列中的各频谱特征构建为图结构,挖掘出各频谱特征之间的全局语义关联特征;对所述不同频段的频谱特征对应的封装特征进行加权融合,得到融合封装特征,将融合封装特征与所述全局语义关联特征进行聚合,得到聚合特征;基于所述聚合特征,翻译得到目标语言的语音数据。在本发明中,提高了跨语言翻译的准确性。