摘要
本发明公开了一种基于虚拟样本生成的燃煤电厂碳排放预测方法及装置,预测方法包括:利用皮尔逊相关系数对燃煤机组生产数据进行特征选择以获得原始数据集;利用获得的原始数据集,初始化随机森林模型;利用获得的原始数据集和初始化的随机森林模型,构建虚拟样本集;虚拟样本集包括虚拟样本的输入和虚拟样本的输出;利用t分布随机邻域嵌入和插值算法,由获得的原始数据集生成虚拟样本的输入;利用获得的原始数据集和生成的虚拟样本输入得到虚拟样本的输出;集成构建的虚拟样本集和获得的原始数据集,重构随机森林模型。本发明通过扩充样本集训练随机森林模型,提高燃煤电厂碳排放预测模型的精度。