基于视觉模型的图像含义解析场景一致性评估系统

申请号：CN202511526127

申请日期：2025-10-24

公开号：CN120997650B

公开日期：2025-12-23

类型：发明专利

摘要

本申请涉及图像处理技术领域，公开了一种基于视觉模型的图像含义解析场景一致性评估系统，旨在解决现有技术在光照变化、角度偏移和局部遮挡等复杂环境下识别稳定性不足的问题。该系统包括：图像输入模块，用于接收并预处理多张图像；视觉大模型解析模块，对预处理后的图像进行多维度语义特征提取；结构化描述生成模块，将语义特征转换为统一格式的结构化文本描述；场景一致性评估模块，对多张图像的结构化文本描述进行逻辑一致性分析；结果输出模块，生成并输出最终的一致性评估报告。本申请通过采用上述技术方案，能够有效提升系统在复杂环境下的识别稳定性，实现对图像内容的多维度语义理解，并显著降低多视角图像评估的误判率。

技术关键词

评估系统语义特征提取场景文本多尺度卷积神经网络特征提取网络空间关系推理机器学习模型光学字符识别技术输入模块底层视觉特征输出模块逻辑 BERT模型图像评估