一种特定人物的视频生成方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种特定人物的视频生成方法、装置、设备及介质
申请号:CN202411974178
申请日期:2024-12-30
公开号:CN119815147A
公开日期:2025-04-11
类型:发明专利
摘要
本发明公开了一种特定人物的视频生成方法、装置、设备及介质。该方法包括:根据用户输入的待生成视频的视频提示词以及目标人物的人脸图像,分别获取提示词文本生成特征以及抽象人脸面部特征;通过多模态变压器扩散生成模型,对提示词文本生成特征以及抽象人脸面部特征进行多轮处理,获取目标人物相关图像;其中,多模态变压器扩散生成模型中通过跨注意力机制实现特征融合;根据目标人物相关图像,生成特定人物视频。采用上述技术方案,能够实现仅需单张人物图像,即可生成特定人物视频,算力消耗低,耗时较短,能够高效、便捷的获取特定人物的视频,提高用户的使用体验。
技术关键词
人脸面部特征 生成特征 视频生成方法 文本 多模态 视频生成模型 人脸特征 人脸图像识别 注意力机制 多层感知机 变压器 预训练模型 视频生成装置 图像获取模块 处理器 可读存储介质 特征提取模块
系统为您推荐了相关专利信息
载运平台 噪声功率谱 高浓度粉尘 故障诊断方法 环境粉尘
语义向量 支撑电容器 柔性直流 数据 分析方法
内容审核模型 视频 样本 审核规则 文本识别
戒指鼠标 互译系统 显示终端 文本 语音识别单元
语音音频数据 智能对话控制方法 智能外呼机器人 音频特征数据 语音情感识别模型