基于场景图的文生图大模型提示词优化方法、电子设备、介质
申请号:CN202411054769
申请日期:2024-08-01
公开号:CN119167940A
公开日期:2024-12-20
类型:发明专利
摘要
本发明公开了一种基于场景图的文生图大模型提示词优化方法、电子设备、介质,包括:获取第一提示词,解析得到第一场景图;将第一提示词输入至文生图大模型中,生成对应的第一图片;将第一场景图与第一图片进行语义对齐得到第二场景图;将第一提示词以及第二场景图输入至预先训练好的提示词优化模型中,输出第二提示词;包括:对第一提示词进行编码得到文本特征,对第二场景图进行编码、卷积得到语义特征;将文本特征、语义特征拼接后输入至文本编辑解码器,输出至少包括删除、重排、插入在内的动作;基于输出的删除、重排、插入动作对第一提示词进行处理,得到第二提示词。
技术关键词
场景
图片
实体
语义特征
解码器
图文
指标
模态特征
美学
关系
文本
编码
表达式
电子设备
处理器
问答模型
计算机程序产品
存储器
超参数