一种基于AI的儿童故事视频生成方法及系统

申请号：CN202511289500

申请日期：2025-09-10

公开号：CN120812370B

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种基于AI的儿童故事视频生成方法及系统，涉及人工智能与多媒体交叉技术领域，包括，本发明通过构建融合情感建模能力的AI模型，将用户输入的原始文本生成脚本；构建图像生成组合模型，定义联合损失函数，使用Sobel边缘检测算法计算轮廓图像的边缘强度图，使用块匹配算法计算帧变化的光流场，进行彩色图像动态帧对齐；使用微调WaveNet模型生成音频；通过构建图像生成组合模型，结合StyleGAN3‑T模型、LDM模型，定义联合损失函数，使用Sobel边缘检测算法和块匹配算法计算边缘强度图和光流场，实现彩色图像的动态帧对齐，提升生成视频的帧间连续性。

技术关键词

儿童故事 Sobel边缘检测算法轮廓图像视频生成方法联合损失函数块匹配算法生成彩色图像生成脚本语义向量可视化界面文本音频检查单元定义优化器双向注意力机制解码器