内容生成方法、装置、电子设备及存储介质

申请号：CN202411903489

申请日期：2024-12-20

公开号：CN119830028A

公开日期：2025-04-15

类型：发明专利

摘要

本公开实施例公开了一种内容生成方法、装置、电子设备及存储介质，通过获取查询图像和查询文本，对查询文本进行编码得到第一文本特征，在对查询文本进行编码的过程中，对前馈网络的输出特征进行多种粒度的池化得到多种池化特征，将多种池化特征融合得到融合池化特征，基于融合池化特征与输出特征之和得到第一文本特征，对查询图像进行编码得到视觉特征，将视觉特征与第一文本特征进行融合得到查询特征，根据查询特征检索出参考文本，调用视觉大语言模型基于参考文本、查询图像以及查询文本进行内容生成，得到目标内容，能够提升内容生成的准确性。

技术关键词

池化特征内容生成方法视觉特征输出特征文本编码器查询特征大语言模型图像样本标签文本内容生成装置编码模块网络电子设备对象检测计算机程序产品处理器

系统为您推荐了相关专利信息

一种反馈式图像生成系统及方法

图像生成系统噪声图像图像生成方法非暂态计算机可读存储介质文本编码器

基于隐式情感增强与注意力机制的多模态视频摘要方法及装置

视频摘要方法注意力机制生成视频摘要情感特征语义

一种基于多特征显著图融合的对抗样本生成方法和装置

人工智能模型样本生成方法图片输出特征训练集

一种基于两阶段调整的视频扩散模型概念擦除方法及系统

概念擦除方法矩阵两阶段噪声

一种固态硬盘状态预测模型构建方法

固态硬盘状态数据预测模型构建方法编码模块样本