一种用于样本数据的整合方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种用于样本数据的整合方法
申请号:CN202411555448
申请日期:2024-11-04
公开号:CN119415960A
公开日期:2025-02-11
类型:发明专利
摘要
本发明公开一种用于样本数据的整合方法,涉及数据处理领域,包括:S1、依据存量数据信息,并总结筛选出明确具备某一特征变量的样本数据;S2、整合筛选出可以纳入模型的样本数据,并对样本原始数据进行初步的处理和整理,得到处理后的样本数据;S3、对S2处理后的样本数据进行数据转换,从具有S1的存量数据信息中筛选对预测未来特征变量信息有帮助的特征变量;S4、基于S3已筛选的各种特征变量,通过构建梯度提升机算法模型来进一步进行重要特征提取,使用测试集对模型进行优劣评估,从而得到最终可以对预测变量有帮助的特征变量;本发明中,通过构建特征模型,可有效提高后续的数据分析工作。
技术关键词
样本 变量 数据 梯度提升机 算法模型 决策 处理器 电子装置 存储器 指数 计算机 指标 程序 参数