在文本到图像扩散模型上学习用于3D感知图像生成的连续控制

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
在文本到图像扩散模型上学习用于3D感知图像生成的连续控制
申请号:CN202411880093
申请日期:2024-12-19
公开号:CN120472082A
公开日期:2025-08-12
类型:发明专利
摘要
一种用于图像处理的方法、装置、非暂态计算机可读介质和系统,包括获得描述元件的文本提示和元件的连续属性的属性值;嵌入文本提示以获得文本嵌入空间中的文本嵌入;嵌入属性值以获得文本嵌入空间中的属性嵌入;以及基于文本嵌入和属性嵌入生成合成图像,其中合成图像基于属性值描绘元件的连续属性。
技术关键词
图像生成模型 训练集 非暂态计算机可读介质 生成训练图像 令牌 元件 存储器 文本编码器 多层感知器 机器学习模型 对象 参数 图像处理 重构 处理器 噪声 标识