多模态内容生成方法、装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态内容生成方法、装置、电子设备及存储介质
申请号:CN202510435057
申请日期:2025-04-08
公开号:CN120493875A
公开日期:2025-08-15
类型:发明专利
摘要
本发明提供一种多模态内容生成方法、装置、电子设备及存储介质,通过接收用户上传的文档并进行内容提取;对提取的内容进行分块解析和语义重组,生成PPT文本大纲及对应的讲解脚本;根据所述PPT文本大纲匹配或动态生成视觉素材,得到初版PPT;对所述初版PPT进行迭代优化,将优化后的PPT与所述讲解脚本进行合成以得到讲解视频,能够处理复杂结构化文档或非结构化内容,确保生成的大纲条理清晰、内容准确,并且,通过迭代优化,输出符合视觉美学的多模态内容。
技术关键词
内容生成方法 动作策略 文本 页面 脚本 非暂态可读存储介质 并行编码 视觉 融合多模态特征 内容生成装置 空间金字塔池化 图像生成模型 语义 图表 分块 美学 参数 布局特征 电子设备