摘要
本申请涉及图像处理技术领域,公开了一种基于视觉模型的图像含义解析场景一致性评估系统,旨在解决现有技术在光照变化、角度偏移和局部遮挡等复杂环境下识别稳定性不足的问题。该系统包括:图像输入模块,用于接收并预处理多张图像;视觉大模型解析模块,对预处理后的图像进行多维度语义特征提取;结构化描述生成模块,将语义特征转换为统一格式的结构化文本描述;场景一致性评估模块,对多张图像的结构化文本描述进行逻辑一致性分析;结果输出模块,生成并输出最终的一致性评估报告。本申请通过采用上述技术方案,能够有效提升系统在复杂环境下的识别稳定性,实现对图像内容的多维度语义理解,并显著降低多视角图像评估的误判率。