人脸视频生成方法及其模型训练方法、装置及相关设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
人脸视频生成方法及其模型训练方法、装置及相关设备
申请号:CN202411550338
申请日期:2024-10-31
公开号:CN119399816A
公开日期:2025-02-07
类型:发明专利
摘要
本申请涉及人工智能技术领域,公开了一种人脸视频生成方法及其模型训练方法、装置及相关设备。该人脸视频生成模型训练方法包括:获取待处理的初始人脸图像、初始音频数据、以及情绪标签;通过预设的3D人脸重建工具处理初始人脸图像,得到第一表情特征数据;从初始音频数据提取初始音频特征数据,根据情绪标签生成对应的情绪单热特征向量;融合第一表情特征数据、初始音频特征数据和情绪单热特征向量,得到第一人脸表情系数;注入预设的噪声数据至初始人脸图像,得到第二人脸图像;输入初始人脸图像、第二人脸图像和第一人脸表情系数至预设的条件扩散模型,得到带表情的目标人脸视频,生成的人脸视频更加精准表达情绪标签所对应的面部表情。
技术关键词
视频生成模型 人脸表情 音频特征数据 表情特征 视频生成方法 非易失性计算机可读存储介质 图像特征数据 生成器网络 人脸纹理 噪声数据 注意力 计算机可执行指令 模型训练方法 编码器模块 深度学习模型