用于视觉生成的方法、装置、设备、存储介质和程序产品
申请号:CN202411700246
申请日期:2024-11-25
公开号:CN119648854A
公开日期:2025-03-18
类型:发明专利
摘要
本公开的实施例提供了视觉生成的方法、装置、设备、存储介质和程序产品。该方法包括:响应于接收到包括第一图像的内容生成请求,利用经训练的语义编码器从第一图像提取语义特征表示,并且利用经训练的视觉编码器从第一图像提取视觉特征表示,其中语义特征表示指示第一图像的语义信息并且视觉特征表示指示第一图像的视觉信息,并且其中语义编码器基于第一样本图像和样本文本被训练,样本文本描述第一样本图像的语义信息;通过聚合语义特征表示和视觉特征表示,生成第一图像对应的目标特征表示;以及利用经训练的内容生成模型,至少基于目标特征表示来确定针对内容生成请求的响应内容。
技术关键词
视觉特征
图像提取语义特征
样本
解码器
文本编码器
离散特征
处理单元
融合特征
计算机程序产品
序列
可读存储介质
存储器
处理器
电子设备