摘要
本申请实施例公开了图像分析方法、装置、设备及存储介质,用以解决相关技术中难以对图像中的具体对象进行针对性分析和描述的问题。所述方法包括:获取待分析图像对应的区域掩码图像;区域掩码图像包括待分析图像中的各对象的图像位置信息和身份信息;对待分析图像和区域掩码图像进行图像融合处理,得到目标图像;将目标图像输入预先训练的多模态模型中进行图像分析,得到待分析图像中的至少一个对象的图像描述信息;图像描述信息包括身份信息和行为信息。该技术方案使得多模态模型能够结合各对象的图像位置信息和身份信息对图像中的具体对象进行针对性分析和描述,以输出更有针对性、更有价值的图像描述信息。