摘要
本发明公开一种用于样本数据的整合方法,涉及数据处理领域,包括:S1、依据存量数据信息,并总结筛选出明确具备某一特征变量的样本数据;S2、整合筛选出可以纳入模型的样本数据,并对样本原始数据进行初步的处理和整理,得到处理后的样本数据;S3、对S2处理后的样本数据进行数据转换,从具有S1的存量数据信息中筛选对预测未来特征变量信息有帮助的特征变量;S4、基于S3已筛选的各种特征变量,通过构建梯度提升机算法模型来进一步进行重要特征提取,使用测试集对模型进行优劣评估,从而得到最终可以对预测变量有帮助的特征变量;本发明中,通过构建特征模型,可有效提高后续的数据分析工作。