多媒体资源生成方法、装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多媒体资源生成方法、装置、电子设备及存储介质
申请号:CN202510954716
申请日期:2025-07-10
公开号:CN120451324B
公开日期:2025-10-21
类型:发明专利
摘要
本公开关于一种多媒体资源生成方法、装置、电子设备及存储介质。该方法包括:获取用于多媒体资源生成的第一文本提示词以及参考多媒体资源;基于双编码器对参考多媒体资源进行语义提取和多媒体细节提取,得到第一多媒体语义特征和第一多媒体细节特征;将第一文本提示词对应的第一文本特征、第一多媒体语义特征和第一多媒体细节特征进行拼接,得到第一序列拼接特征;将第一序列拼接特征输入目标Transformer‌模型进行特征交互处理,得到第一目标交互特征;将预设噪声信息和第一目标交互特征,输入目标扩散模型进行多媒体资源生成处理,得到第一生成多媒体资源。根据本公开提供的技术方案,能够适配更加丰富多样的多媒体资源生成场景。
技术关键词
交互特征 生成多媒体 噪声信息 双编码器 资源 文本 生成方法 样本 序列 电子设备 拼接模块 编码模块 语义特征提取 多模态信息 计算机 处理器 可读存储介质