一种基于改进LLaVA的草莓病害多模态视觉问答方法
申请号:CN202511200131
申请日期:2025-08-26
公开号:CN121033635A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于改进LLaVA的草莓病害多模态视觉问答方法,属于人工智能技术领域,包括获取多种草莓病害植株图像,基于草莓病害植株图像构建草莓病害视觉问答数据集;对LLaVA模型进行改进;使用改进后的LLaVA模型进行微调,得到草莓病害视觉问答模型;根据草莓病害视觉问答模型进行问答。本发明采用上述方法,通过对LLaVA模型进行改进,提高了对草莓病害植株的识别能力,提高了模型对草莓病害诊断与决策的准确率。
技术关键词
草莓病害
视觉问答方法
视觉问答模型
视角
多模态
裁剪模块
高分辨率图像分割
增强子
大语言模型
局部细节特征
交叉注意力机制
训练集
人工智能技术
像素
模运算
矩阵