基于声纹的动画角色智能同步用户方法

申请号：CN202411076672

申请日期：2024-08-07

公开号：CN119048650A

公开日期：2024-11-29

类型：发明专利

摘要

本发明涉及基于声纹的动画角色智能同步用户方法，具体涉及多模态数据处理领域，利用高清摄像头采集用户形象数据，并对用户形象数据进行缩放、像素点位置的匹配和填充，通过直方图均衡化增强图像对比度，利用高斯滤波加权对用户形象数据存在噪声进行去除，使用户形象数据在固定尺寸下保持清晰，并且细节丰富，构建卷积神经网络基于动画的主色调和角色形象输出最终的用户虚拟形象，利用麦克风采集用户声纹数据，通过傅里叶变换对每个窗口的声音信号进行频谱表示，构建Transformer编码器并添加自注意力机制和前馈神经网络，将用户虚拟形象和用户声纹转换的动画语音进行同步并自动替换，为用户提供更加个性化和沉浸式的交互体验。

技术关键词

面部关键点动画构建卷积神经网络前馈神经网络直方图均衡化注意力机制像素点数据高清摄像头语音麦克风编码器结构滤波信号对比度索引噪声邻域坐标