口播视频生成方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
口播视频生成方法、装置、设备及存储介质
申请号:CN202510007175
申请日期:2025-01-02
公开号:CN119835491A
公开日期:2025-04-15
类型:发明专利
摘要
本申请公开了一种口播视频生成方法、装置、设备及存储介质,涉及计算机技术领域,公开的方法包括:接收口播音频样本以及当前文本内容;通过初始人物模型对口播音频样本进行学习,以生成与口播音频样本的音色对应的目标人物模型;通过目标人物模型基于当前文本内容生成口播视频。由于本申请通过利用初始人物模型对口播音频样本进行学习的方式来生成与口播音频样本的音色对应的目标人物模型,因此,相较于现有技术基于文本只能生成默认风格音色的口播视频,本申请通过口播音频样本能够实现对对初始人物模型的音色进行调整,从而能够满足用户需求,有效提高了用户使用体验。
技术关键词
人物模型 视频生成方法 音色特征 音频 样本 文本 人物特征 视频生成设备 视频生成装置 数据接收模块 处理器 可读存储介质 指令 存储器 风格 参数 计算机
系统为您推荐了相关专利信息
组合预测方法 长短期记忆网络 天气 场景 聚类算法
多层次 保真度约束 数据 累积分布函数 概率密度函数
视频生成方法 生成对抗式网络 音视频 MFCC算法 人脸图像信息
矿山灾害 决策系统 专家知识库 图谱 数据融合平台
医学图像分割方法 文本编码器 医学图像数据集 视觉 图像嵌入