一种基于AIGC的智能MV生成方法、系统、设备及介质

申请号：CN202510264817

申请日期：2025-03-07

公开号：CN119788886B

公开日期：2025-07-04

类型：发明专利

摘要

本申请涉及一种基于AIGC的智能MV生成方法、系统、设备及介质，属于人工智能生成内容技术领域。其中，方法包括：接收用户输入的原始音乐文件和用户指令；对原始音乐文件进行音频预处理生成标准化音频信号，并将用户指令映射为语义向量；提取节奏特征和情感特征，生成音乐特征向量并与语义向量进行特征对齐，基于扩散模型生成初始关键帧序列；对初始关键帧序列进行粒子特效密度动态调整和镜头切换点生成，输出增强关键帧序列并进行光流插帧和长时序预测，生成优化视频帧序列；根据目标平台参数对优化视频帧序列进行分块并行渲染，生成MV文件及元数据。本申请能够实现音频与视觉内容的深度融合，并根据用户的个性化需求生成高质量的视频内容。

技术关键词

关键帧序列语义向量节奏特征镜头 MFCC特征生成方法情感特征视频帧音乐矩阵粒子强化学习策略音频运动矢量场风格网络优化频段时序参数