摘要
本发明涉及数据处理技术领域,具体涉及基于大数据分析的建筑工程造价分析方法及系统,包括:从若干份建筑工程造价文件中,获取若干个信息维度序列再获取每个信息维度序列对建筑工程造价的影响因子和重要程度,以此对所有建筑工程造价文件进行聚类操作,得到聚类结果,根据聚类结果、所有信息维度序列以及所有建筑工程造价文件中的建筑工程造价值,构建一个随机森林模型,将未来建筑工程中的所有信息维度输入到随机森林模型中,输出未来建筑工程的建筑工程造价预测值。本发明通过获取建筑工程造价文件之间的优选聚类距离,计算合适的邻域半径与最小样本数,从而得到准确的聚类结果,用以保障后续求取的建筑工程造价预测值的准确性。