基于多模态语义融合的全景图像质量评价方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态语义融合的全景图像质量评价方法和装置
申请号:CN202510549970
申请日期:2025-04-29
公开号:CN120070450A
公开日期:2025-05-30
类型:发明专利
摘要
本发明涉及全景图像质量评价领域,具体为基于多模态语义融合的全景图像质量评价方法和装置。所述方法包括根据目标失真全景图得到文本语义特征和全局视觉语义特征,再通过上述两个特征得到多模态全局语义特征;将目标失真全景图分为若干视口图,再提取每个视口的局部视觉语义特征,通过每个视口的局部视觉语义特征与文本语义特征得到每个视口的局部视觉语义特征,再将所有视口的局部视觉语义特征进行拼接,得到多模态局部语义特征;将多模态全局语义特征和多模态局部语义特征进行拼接,得到质量评价分数。以此方式,可以利用视觉语义特征和文本语义特征进行跨模态融合,能够获取丰富的模态间的语义交互关系,提高模型特征表示能力。
技术关键词
局部视觉语义 多模态 语义特征提取 全景图 注意力 跨模态 融合特征 视觉特征提取 特征提取模块 采样模块 评价方法 文本生成模型 图像 计算机 评价装置