文生图场景下的模型训练方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文生图场景下的模型训练方法、装置、设备及介质
申请号:CN202411698709
申请日期:2024-11-25
公开号:CN119648827A
公开日期:2025-03-18
类型:发明专利
摘要
本公开提供了一种文生图场景下的模型训练方法、装置、设备及介质,属于人工智能领域。该方法包括:构建多个图文样本对;对多个图文样本对中包括的原始文本进行数据扰动,得到编辑文本;对编辑文本和多个图文样本对中包括的原始文本进行文本特征提取,得到编辑文本的第一文本特征和多个图文样本对的第二文本特征;对多个图文样本对中包括的图像进行图像特征提取,得到多个图文样本对的图像特征;以学习文本与图像之间的相关性以及文本与文本之间的相关性为目标,基于第一文本特征、第二文本特征和图像特征进行模型训练,得到文生图场景下用于执行文本编码的模型。本公开确保了文生图任务中基于语义相近的文本能够生成相似的图像。
技术关键词
文本 模型训练方法 图文 编辑 样本 场景 图像特征提取 矩阵 特征提取模块 语义 电子设备 标签 元素 可执行程序代码 模型训练装置 处理器 可读存储介质 编码 计算机程序产品