一种唇形合成模型设计方法、装置、存储介质和程序产品
申请号:CN202411964767
申请日期:2024-12-27
公开号:CN119888426A
公开日期:2025-04-25
类型:发明专利
摘要
本发明提出一种唇形合成模型设计方法、装置、存储介质和程序产品,涉及计算机视觉技术领域。其中,唇形合成模型设计方法包括:数据收集及预处理,获得原面部图、原情绪标签及音频特征;使用生成器获得恢复面部图及恢复情绪标签;使用判别器对原面部图与恢复面部图进行对抗训练;使用图片重建损失函数、感知损失函数、对抗损失函数、情绪损失函数进行反向迭代;针对待生成视频进行模型微调训练。本发明提高了唇形合成图像生成的整体精确性和图像质量,避免了相关生成瑕疵和错误的出现。
技术关键词
恢复面部
模型设计方法
感知损失函数
音频特征
音频编码
标签
视频
图片
计算机视觉技术
深度神经网络
情绪特征
计算机装置
计算机程序产品
处理器
解码模块
编码模块
可读存储介质
存储器