数字人生成方法、设备、程序产品及介质

申请号：CN202411071805

申请日期：2024-08-06

公开号：CN119071597A

公开日期：2024-12-03

类型：发明专利

摘要

本发明提供了一种数字人生成方法、设备、程序产品及介质，属于人工智能技术领域，所述方法包括：生成目标文本信息对应的音频信息；按照预设图像序列的长度，对所述音频信息进行切分，获得至少两个音频帧序列，所述预设图像序列中的图像帧包含数字人形象；基于所述预设图像序列，并行处理所述至少两个音频帧序列，分别获得每个所述音频帧序列对应的数字人图像序列；对所述音频信息和所述至少两个音频帧序列分别对应的数字人图像序列进行合成处理，获得目标数字人视频。本发明实施例中，能够有效减少基于长文本生成数字人的时间，提高了处理效率，更好地满足了生产需求。

技术关键词

图像序列音频人脸生成方法关键点面部特征点校正处理器可读存储介质异步方式人工智能技术计算机程序产品超分辨率视频坐标文本存储器

系统为您推荐了相关专利信息

机器人的故障处理方法、装置和系统

故障机器人故障类别标识指令策略

一种口腔系统发病风险预测方法及系统

风险预测方法中性粒细胞计数灰度共生矩阵淋巴细胞风险预测模型

一种基于多模态大模型的图像质量分类处理方法及系统

巡检图像多模态像素点数据区域位置信息

一种工业缺陷的检测方法、装置、设备及存储介质

缺陷类别图文文本多模态工业缺陷检测

一种地质雷达收集的信号收集及解译系统

地质雷达信号采集模块电源供应模块频域特征提取卷积神经网络算法