一种基于图对齐大语言模型的文生图方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于图对齐大语言模型的文生图方法
申请号:CN202410973330
申请日期:2024-07-19
公开号:CN118823159A
公开日期:2024-10-22
类型:发明专利
摘要
本申请公开了一种基于图对齐大语言模型的文生图方法及联合模型的训练方法、装置、存储介质、设备和计算机程序产品,属于生成图技术领域,包括:获取描述文本,并生成一个随机噪声图;将描述文本输入图对齐大语言模型,以获得描述文本的图结构特征数据;将随机噪声图以及图结构特征数据输入图扩散模型,以通过图扩散模型的分数预测器确定随机噪声图的噪声,并从随机噪声图去除噪声,以及将去除噪声后的随机噪声图输出为目标图。基于本申请实施例的方法,解决了图生成技术实用性低的问题。
技术关键词
大语言模型 随机噪声 文本 训练注意力 训练集 数据 计算机程序产品 上存储计算机程序 节点特征 训练装置 预测阈值 关系 处理器 可读存储介质 特征提取模块 训练特征
系统为您推荐了相关专利信息
语义 音频 大语言模型 语音 递归神经网络模型
解码图像 生成方法 功能性近红外光谱 文本 语音
数据智能管理方法 样本 文本 森林模型 数值
信息安全威胁 协同分析方法 功能系统 智能设备 信息安全知识图谱
数据处理方法 数据采集网络 机器学习模型 异常数据 集成学习融合模型