基于视觉模型的图像含义解析场景一致性评估系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于视觉模型的图像含义解析场景一致性评估系统
申请号:CN202511526127
申请日期:2025-10-24
公开号:CN120997650B
公开日期:2025-12-23
类型:发明专利
摘要
本申请涉及图像处理技术领域,公开了一种基于视觉模型的图像含义解析场景一致性评估系统,旨在解决现有技术在光照变化、角度偏移和局部遮挡等复杂环境下识别稳定性不足的问题。该系统包括:图像输入模块,用于接收并预处理多张图像;视觉大模型解析模块,对预处理后的图像进行多维度语义特征提取;结构化描述生成模块,将语义特征转换为统一格式的结构化文本描述;场景一致性评估模块,对多张图像的结构化文本描述进行逻辑一致性分析;结果输出模块,生成并输出最终的一致性评估报告。本申请通过采用上述技术方案,能够有效提升系统在复杂环境下的识别稳定性,实现对图像内容的多维度语义理解,并显著降低多视角图像评估的误判率。
技术关键词
评估系统 语义特征提取 场景 文本 多尺度卷积神经网络 特征提取网络 空间关系推理 机器学习模型 光学字符识别技术 输入模块 底层视觉特征 输出模块 逻辑 BERT模型 图像评估