基于增强学习的多轮AI图像生成内容一致性变换方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于增强学习的多轮AI图像生成内容一致性变换方法
申请号:CN202511432289
申请日期:2025-10-09
公开号:CN120912420A
公开日期:2025-11-07
类型:发明专利
摘要
本发明涉及图像处理技术领域,具体公开了基于增强学习的多轮AI图像生成内容一致性变换方法,通过获取含语义标注的初始图像数据集,提取多尺度特征,构建含策略网络和值函数网络的增强学习智能体,生成旋转、缩放等变换动作,执行多轮变换,计算结构、感知、语义多维度一致性奖励,采用近端策略优化算法更新网络参数,优化变换策略,最终输出最优变换图像及一致性评估报告,本发明通过构建基于增强学习的智能体,结合多尺度图像特征提取、多轮变换策略优化及多维度一致性评估,实现复杂场景下多轮AI图像生成过程中内容的一致性变换,有效应对遮挡、复杂光照、多物体密集交互等场景导致的一致性下降问题,确保核心内容的稳定性。
技术关键词
图像特征向量 策略 卷积神经网络结构 图像特征提取 报告 特征提取网络 语义分割模型 更新网络参数 全局平均池化 指标 场景 亮度 输出模块 数据 多尺度特征 图像处理技术