多源单图数字人生成方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多源单图数字人生成方法、装置、设备及存储介质
申请号:CN202510667558
申请日期:2025-05-22
公开号:CN120747309A
公开日期:2025-10-03
类型:发明专利
摘要
本发明提供一种多源单图数字人生成方法、装置、设备及存储介质,涉及人工智能技术领域。该方法包括:获取待处理图像、获取驱动音频以及获取驱动视频;对所述待处理图像进行人脸检测处理,得到第一人脸图像;基于所述第一人脸图像和所述驱动音频,确定音频驱动结果;对所述驱动视频进行人脸检测处理,确定包含第二人脸图像的人脸视频;基于所述人脸视频和所述音频驱动结果进行融合处理,生成数字人的人脸图像视频。本发明实施例用以解决现有技术中生成的数字人脸部动作和说话音频不匹配,准确性较低的缺陷,实现通过结合待处理图像、驱动音频和驱动视频,能够生成音频和脸部动作具有高匹配度的单图数字人,且单图数字人具有多样性和灵活性。
技术关键词
视频 生成方法 图像 人脸动作 多尺度特征 非暂态计算机可读存储介质 三维人脸建模 音频特征 融合特征 生成多尺度 处理器 人工智能技术 计算机程序产品 坐标 面部 光流场 分辨率 生成装置
系统为您推荐了相关专利信息
训练数据生成方法 图像 字符 文本 资产
水轮机 教学 虚拟穿戴设备 轨迹 运维
定制化产品 编码向量 数据管理方法 云平台 图像特征提取
医疗影像分析方法 腹腔镜图像 生成解剖结构 边缘检测算法 分段
病理切片图像 细胞检测方法 细胞形态特征 病变特征 细胞检测系统