基于声纹的动画角色智能同步用户方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于声纹的动画角色智能同步用户方法
申请号:CN202411076672
申请日期:2024-08-07
公开号:CN119048650A
公开日期:2024-11-29
类型:发明专利
摘要
本发明涉及基于声纹的动画角色智能同步用户方法,具体涉及多模态数据处理领域,利用高清摄像头采集用户形象数据,并对用户形象数据进行缩放、像素点位置的匹配和填充,通过直方图均衡化增强图像对比度,利用高斯滤波加权对用户形象数据存在噪声进行去除,使用户形象数据在固定尺寸下保持清晰,并且细节丰富,构建卷积神经网络基于动画的主色调和角色形象输出最终的用户虚拟形象,利用麦克风采集用户声纹数据,通过傅里叶变换对每个窗口的声音信号进行频谱表示,构建Transformer编码器并添加自注意力机制和前馈神经网络,将用户虚拟形象和用户声纹转换的动画语音进行同步并自动替换,为用户提供更加个性化和沉浸式的交互体验。
技术关键词
面部关键点 动画 构建卷积神经网络 前馈神经网络 直方图均衡化 注意力机制 像素点 数据 高清摄像头 语音 麦克风 编码器结构 滤波 信号 对比度 索引 噪声 邻域 坐标