一种文本生成图像方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种文本生成图像方法、装置、设备及介质
申请号:CN202510244910
申请日期:2025-03-03
公开号:CN119722875B
公开日期:2025-05-13
类型:发明专利
摘要
本申请涉及图像处理技术领域,公开了一种文本生成图像方法、装置、设备及介质,其中,方法包括:响应于获取到的包含目标对象的文本提示词,生成文本提示词对应的初始图像;其中,文本提示词包括目标对象的目标数量,初始图像包括目标对象的生成数量;在目标数量与生成数量不相等的情况下,对初始图像生成过程中的候选边界框的位置进行优化,生成优化后的边界框;基于优化后的边界框对初始图像生成过程中的当前潜在表示进行优化,得到目标潜在表示;基于目标潜在表示更新初始图像,生成目标图像,以使目标图像中目标对象的生成数量与目标数量相等。本申请提供的技术方案,能够精确控制生成图像中目标数量。
技术关键词
文本生成图像方法 注意力 对象 图像生成单元 可读存储介质 图像处理技术 存储器 处理器 指令 掩膜 计算机设备 像素点 因子 坐标
系统为您推荐了相关专利信息
工作项 日期 管理方法 递归算法 动态
人机交互方法 计算机程序代码 计算机设备 可读存储介质 人机交互装置
模拟模型 生成对抗网络 稀土 多分支 计算机装置
偏差 数据 参数 人机交互技术 计算机设备
仿真方法 软件 后处理模块 工业 动作捕捉模块