摘要
本申请提供了一种多媒体数据生成方法、系统、电子设备及存储介质,涉及多媒体处理技术领域,其中,该方法包括:获取待处理多媒体数据,其中,待处理多媒体数据中包括目标音频数据;对目标音频数据进行识别得到目标文本字幕,以及对目标音频数据进行分析得到情感分析结果;根据目标文本字幕和情感分析结果生成对应的目标人脸动画数据,其中,目标人脸动画数据包括嘴型数据;通过目标长短期记忆网络模型对目标音频数据、目标文本字幕及目标人脸动画数据进行同步处理,得到目标多媒体数据。实施本申请提供的技术方案,达到了提高多媒体数据的生成效率的效果。