基于视觉语言对应的AI生成全景图像质量评价方法与系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于视觉语言对应的AI生成全景图像质量评价方法与系统
申请号:CN202510425337
申请日期:2025-04-07
公开号:CN119919423B
公开日期:2025-07-18
类型:发明专利
摘要
本发明提出一种基于视觉语言对应的AI生成全景图像质量评价方法与系统,该方法包括:获取AI生成全景图像,对AI生成全景图像进行采样;基于图像块集合,利用视觉编码器对图像块进行特征表示;利用语言编码器对AI生成全景图像附有的文本描述进行特征表示;对图像块的视觉特征与文本描述的文本特征依次进行L2归一化处理和余弦相似度计算;利用全连接网络和归一化函数对融合后的特征向量进行处理。本发明使用视觉语言对应分析,对AI生成全景图像以及其相对应的文本描述,两者联动分析,利用学习到的视觉语言对应关系,高效准确预测AI生成全景图像的质量分数。
技术关键词
生成全景图像 图像块 语言编码器 文本 评价方法 多模态特征融合 序列 视觉特征提取 模块 掩码矩阵 网络 评价系统 索引