多模态内容生成方法、装置、电子设备及存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
多模态内容生成方法、装置、电子设备及存储介质
申请号:
CN202510435057
申请日期:
2025-04-08
公开号:
CN120493875A
公开日期:
2025-08-15
类型:
发明专利
摘要
本发明提供一种多模态内容生成方法、装置、电子设备及存储介质,通过接收用户上传的文档并进行内容提取;对提取的内容进行分块解析和语义重组,生成PPT文本大纲及对应的讲解脚本;根据所述PPT文本大纲匹配或动态生成视觉素材,得到初版PPT;对所述初版PPT进行迭代优化,将优化后的PPT与所述讲解脚本进行合成以得到讲解视频,能够处理复杂结构化文档或非结构化内容,确保生成的大纲条理清晰、内容准确,并且,通过迭代优化,输出符合视觉美学的多模态内容。
技术关键词
内容生成方法
动作策略
文本
页面
脚本
非暂态可读存储介质
并行编码
视觉
融合多模态特征
内容生成装置
空间金字塔池化
图像生成模型
语义
图表
分块
美学
参数
布局特征
电子设备