摘要
本发明涉及计算机科学与技术和水利工程交叉技术领域,具体公开了水利大语言模型响应准确性与上下文理解能力评估方法,该方法包括:构建动态更新的水利领域知识库,通过实时接入水文监测数据、解析工程图纸及追踪行业标准更新,形成时空关联知识网络;执行多维度测试,包括基于专业术语库的响应验证、跨文本与图纸的多模态一致性检验,以及模拟溃坝场景的连续决策链压力测试;通过语义匹配算法定位错误至标准具体条款,并关联历史案例生成细粒度报告;生成对抗训练数据集;输出三维风险评估图谱,本发明解决了水利领域大语言模型评估中知识滞后、多模态融合不足、错误定位粗放等问题,提升模型在复杂工程场景下的可靠性与决策支持能力。