摘要
本发明公开了一种基于AI的儿童故事视频生成方法及系统,涉及人工智能与多媒体交叉技术领域,包括,本发明通过构建融合情感建模能力的AI模型,将用户输入的原始文本生成脚本;构建图像生成组合模型,定义联合损失函数,使用Sobel边缘检测算法计算轮廓图像的边缘强度图,使用块匹配算法计算帧变化的光流场,进行彩色图像动态帧对齐;使用微调WaveNet模型生成音频;通过构建图像生成组合模型,结合StyleGAN3‑T模型、LDM模型,定义联合损失函数,使用Sobel边缘检测算法和块匹配算法计算边缘强度图和光流场,实现彩色图像的动态帧对齐,提升生成视频的帧间连续性。