基于文生图模型的物体位置控制方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于文生图模型的物体位置控制方法、装置、设备及介质
申请号:CN202510763027
申请日期:2025-06-09
公开号:CN120599042A
公开日期:2025-09-05
类型:发明专利
摘要
本发明涉及图像检测技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了基于文生图模型的物体位置控制方法、装置、设备及介质,所述方法包括:获取目标物体的初始图像和初始位置描述文本,对所述初始图像进行二值化处理,得到目标掩码图像;提取所述目标掩码图像中所述目标物体的几何特征,根据所述几何特征确定所述目标物体的物体位置数据;根据所述物体位置数据对所述初始位置描述文本进行文本增强处理,得到目标描述文本;对所述目标描述文本进行语义编码,得到语义特征向量,并根据所述语义特征向量生成对应的目标物体图像。本发明可以提高物体位置生成准确性以及提高图像生成效率。
技术关键词
物体位置数据 位置控制方法 文本 位置坐标参数 图像生成器 语义 缩略图 二值化阈值 编码向量 像素点 注意力 位置控制装置 图像检测技术 序列 处理器 分词 矩形
系统为您推荐了相关专利信息
功能识别方法 标识符 语义理解模型 生成轨迹 语义分析模型
交互管理方法 生成用户 自然语言理解模型 手势 数据
音频数据脱敏方法 数据脱敏系统 对象 数据脱敏装置 脱敏策略
卷积神经网络模型 多层次特征 图像分类网络 图像分类方法 样本
特征工程 标签编码器 数据 语义特征 样本