摘要
本申请涉及一种基于AI大模型的数据预处理方法及装置,应用于风电数据处理技术领域,所述方法包括:获取针对风电机组中任一部件的故障诊断指令;通过预先构建的风电专业大语言模型,对故障诊断指令进行识别,得到故障诊断内容;根据故障诊断内容,访问风电运行数据库,并调用故障诊断内容对应的目标知识图谱;基于目标知识图谱,风电运行数据库中提取预设历史时间段内与故障诊断内容相关联的、属于一种或多种数据源的目标运行数据;基于目标知识图谱,对目标运行数据进行处理,得到用于故障检测的目标预处理数据。本申请通过采用大模型调用知识图谱的方式获取多种数据源,提高运行数据信息的利用率,进而提高故障诊断的准确性。