图像识别方法、训练方法、装置、智能体、设备、介质和产品
申请号:CN202510804877
申请日期:2025-06-16
公开号:CN120580552A
公开日期:2025-09-02
类型:发明专利
摘要
本公开提供了一种图像识别方法、训练方法、装置、智能体、设备、介质和产品,涉及人工智能技术领域,尤其涉及大模型、自然语言处理和计算机视觉领域。该图像识别方法包括:根据与输入图像和输入问题对应的图像识别策略,对输入图像的多个候选视觉特征中的至少两个目标视觉特征进行融合,得到融合视觉特征,其中,图像识别策略指示了目标视觉特征的选择方式以及针对目标视觉特征的融合方式,以使融合视觉特征适配输入问题;以及根据融合视觉特征,确定用于输入问题的图像识别结果。
技术关键词
融合视觉特征
融合策略
局部视觉特征
全局视觉特征
特征选择
样本
图像识别方法
视觉特征提取
图像识别装置
多模态
人工智能技术
计算机程序产品
处理器
计算机视觉
训练装置
自然语言
指令