一种矿井复杂场景下大模型驱动的图像局部质量评估方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种矿井复杂场景下大模型驱动的图像局部质量评估方法及系统
申请号:CN202510357242
申请日期:2025-03-25
公开号:CN120318162A
公开日期:2025-07-15
类型:发明专利
摘要
一种矿井复杂场景下大模型驱动的图像局部质量评估方法及系统,采用思维链引导视觉语言大模型生成文本描述,利用多模态信息增强模型对局部的感知评价能力。首先利用视觉语言大模型获取图像显著性局部区域文本,并在思维链的引导下获取图像质量推理文本;然后设计了局部‑全局特征聚合机制,有效地提取并聚合图像的局部和全局特征;最后构建互补文本组对比学习框架,通过跨模态交互优化以强化模型对复杂场景下图像局部质量特征的感知敏感性,增强了盲图像质量评价模型对于图像任意指定区域的评价能力,使其同时具备了对于整幅图像和图像局部的评价能力,可以对矿井图像整体和任意指定区域形成有效的评价,提高了矿井作业的安全系数。
技术关键词
交互模型 矿井 图像局部特征 特征提取方式 大语言模型 局部视觉语义 场景 局部视觉特征 关系 多头注意力机制 模块 多模态信息 存储卡 文本编码器