使用机器学习模型生成图像的方法、系统、存储介质

申请号：CN202510376397

申请日期：2025-03-27

公开号：CN120726153A

公开日期：2025-09-30

类型：发明专利

摘要

本公开描述了用于使用机器学习模型进行快速个性化图像生成的技术。由机器学习模型的第一子模型生成上下文化的特征。上下文化的特征是基于对象图像和文本提示词生成的。对象图像包括目标对象。文本提示词描绘了目标图像，并且指示以下至少一项：改变目标对象的纹理，或者将目标对象放置在特定上下文中。基于对象图像生成自注意力特征。自注意力特征包含关于目标对象的详细信息。通过机器学习模型的第二子模型，基于上下文化的特征和自注意力特征生成目标图像。第二子模型包括上下文交叉注意力层和对象交叉注意力层。目标图像保持目标对象的身份相关信息。

技术关键词

机器学习模型注意力对象计算机可读指令非暂态计算机可读存储介质文本输出提示词处理器图像嵌入纹理编辑身份流水线序列存储器机制颜色

系统为您推荐了相关专利信息

基于大模型的信息处理方法、装置、电子设备及存储介质

意图策略信息处理方法对象语义

一种基于思政课学习的行为预测模型的构建方法

智能感知装置边缘计算机分布式边缘学生教育管理系统面部表情识别模型

一种参数推荐方法及装置

参数推荐方法对象报告计算机程序指令异构

一种基于改进捕鱼优化算法的扫地机器人区域覆盖路径规划方法

覆盖路径规划方法扫地机器人构建栅格地图算法立方体

非编码区单核苷酸变异的功能影响预测方法、装置和设备

多层次特征融合预测特征特征提取模块核苷酸语义特征提取