基于文生图模型的物体位置控制方法、装置、设备及介质
申请号:CN202510763027
申请日期:2025-06-09
公开号:CN120599042A
公开日期:2025-09-05
类型:发明专利
摘要
本发明涉及图像检测技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了基于文生图模型的物体位置控制方法、装置、设备及介质,所述方法包括:获取目标物体的初始图像和初始位置描述文本,对所述初始图像进行二值化处理,得到目标掩码图像;提取所述目标掩码图像中所述目标物体的几何特征,根据所述几何特征确定所述目标物体的物体位置数据;根据所述物体位置数据对所述初始位置描述文本进行文本增强处理,得到目标描述文本;对所述目标描述文本进行语义编码,得到语义特征向量,并根据所述语义特征向量生成对应的目标物体图像。本发明可以提高物体位置生成准确性以及提高图像生成效率。
技术关键词
物体位置数据
位置控制方法
文本
位置坐标参数
图像生成器
语义
缩略图
二值化阈值
编码向量
像素点
注意力
位置控制装置
图像检测技术
序列
处理器
分词
矩形