摘要
本发明公开了多源异构农业数据实时清洗方法及系统,属于数据清洗技术领域,其方法具体包括:获取多源异构数据,对获取的多源异构数据进行一次清洗,得到一次清洗后的多源异构数据,将一次清洗后的多源异构数据转换为标准化数据格式,基于动态时空网格对数据进行时空对齐处理,得到处理后的多源异构数据,预训练清洗网络,将处理后的多源异构数据输入预训练好的清洗网络中进行迭代清洗,随机选取迭代过程中清洗后的多源异构数据文本映射到潜在空间,模拟数据噪声前向扩散和反向扩散过程,解码重构文本,得到最终清洗后的多源异构数据;本申请提高了数据清洗的效率和准确性。