一种用于样本数据的整合方法

申请号：CN202411555448

申请日期：2024-11-04

公开号：CN119415960A

公开日期：2025-02-11

类型：发明专利

摘要

本发明公开一种用于样本数据的整合方法，涉及数据处理领域，包括：S1、依据存量数据信息，并总结筛选出明确具备某一特征变量的样本数据；S2、整合筛选出可以纳入模型的样本数据，并对样本原始数据进行初步的处理和整理，得到处理后的样本数据；S3、对S2处理后的样本数据进行数据转换，从具有S1的存量数据信息中筛选对预测未来特征变量信息有帮助的特征变量；S4、基于S3已筛选的各种特征变量，通过构建梯度提升机算法模型来进一步进行重要特征提取，使用测试集对模型进行优劣评估，从而得到最终可以对预测变量有帮助的特征变量；本发明中，通过构建特征模型，可有效提高后续的数据分析工作。

技术关键词

样本变量数据梯度提升机算法模型决策处理器电子装置存储器指数计算机指标程序参数