基于音素间隔序列的生成音频鉴别与生成区域定位方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于音素间隔序列的生成音频鉴别与生成区域定位方法
申请号:CN202410788550
申请日期:2024-06-19
公开号:CN118366478B
公开日期:2024-10-11
类型:发明专利
摘要
本发明提供了一种基于音素间隔序列的生成音频鉴别与生成区域定位方法,可以应用于人工智能技术领域。该方法包括:对生成音频鉴别请求中待鉴别音频信号的音素进行标记,得到被标记音素;根据被标记音素的连续出现频率,构建待鉴别音频信号的初始音素间隔序列;基于生成音频鉴别请求中携带的生成音频鉴别方式,对初始音素间隔序列进行处理,得到目标音素间隔序列;将目标音素间隔序列输入到生成音频鉴别模型中,通过对提取到的多尺度动力学特征进行分析,输出待鉴别音频信号的真伪鉴别结果。该方法可以适用于生成音频的真假二值鉴别,得到生成音频的整体真伪结果,也适用于区域伪造检测和定位,得到属于真实音频以及属于生成音频的区域定位结果。
技术关键词
音频 多尺度特征提取 序列 样本 区域定位方法 子模块 本子 信号 标记 区域定位装置 标签 输入模块 矩阵 误差 参数 人工智能技术 频率 关系
系统为您推荐了相关专利信息
样本 监测方法 邻域 密度估计方法 定义
建筑物检测方法 主动学习算法 正则化算法 矩阵 度量
蛋白质功能预测方法 序列特征 多头注意力机制 依赖特征 残差结构
摘要 交互方法 生成数字人 视频库 播放器
时序 队列 功率 时间卷积网络 编码器参数