基于AI大模型的跨语言语音翻译方法、装置以及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于AI大模型的跨语言语音翻译方法、装置以及设备
申请号:CN202411958846
申请日期:2024-12-30
公开号:CN119378571B
公开日期:2025-04-18
类型:发明专利
摘要
本发明提供了一种基于AI大模型的跨语言语音翻译方法、装置以及设备,包括:对跨语言语音数据进行分帧以及频谱分析,得到频谱序列;将所述频谱序列输入预先训练完成的AI大模型中;基于特征捕捉路径,通过胶囊网络对所述频谱序列中不同频段的频谱特征进行向量封装,得到封装特征;基于全局关联路径,通过图神经网络将所述频谱序列中的各频谱特征构建为图结构,挖掘出各频谱特征之间的全局语义关联特征;对所述不同频段的频谱特征对应的封装特征进行加权融合,得到融合封装特征,将融合封装特征与所述全局语义关联特征进行聚合,得到聚合特征;基于所述聚合特征,翻译得到目标语言的语音数据。在本发明中,提高了跨语言翻译的准确性。
技术关键词
频谱特征 语音翻译方法 胶囊网络 语义 序列 密钥生成器 频段 混沌系统 节点 多层感知机 语音翻译装置 数据 映射算法 封装单元 符号 非线性 分析单元 处理器