一种多媒体数据生成方法、系统、电子设备及存储介质

申请号：CN202511298754

申请日期：2025-09-11

公开号：CN121037650A

公开日期：2025-11-28

类型：发明专利

摘要

本申请提供了一种多媒体数据生成方法、系统、电子设备及存储介质，涉及多媒体处理技术领域，其中，该方法包括：获取待处理多媒体数据，其中，待处理多媒体数据中包括目标音频数据；对目标音频数据进行识别得到目标文本字幕，以及对目标音频数据进行分析得到情感分析结果；根据目标文本字幕和情感分析结果生成对应的目标人脸动画数据，其中，目标人脸动画数据包括嘴型数据；通过目标长短期记忆网络模型对目标音频数据、目标文本字幕及目标人脸动画数据进行同步处理，得到目标多媒体数据。实施本申请提供的技术方案，达到了提高多媒体数据的生成效率的效果。

技术关键词

生成对抗网络模型长短期记忆网络多媒体字幕人脸音频文本时域特征参数数据生成系统样本唇形动画梯度下降算法电子设备可读存储介质视频帧