一种基于加权正则化信息增益的改进随机森林模型的肺功能诊断预测系统
申请号:CN202510792985
申请日期:2025-06-13
公开号:CN120636774A
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及一种基于加权正则化信息增益的改进随机森林模型的肺功能诊断预测系统,属于诊断系统构建领域。所述系统,包括数据提取模块、数据预处理模块、特征选择模块、模型训练模块、诊断模块、结果输出模块。本发明通过输入文本文件、PDF文件、图片文件三种形式的肺科检测报告单,读取报告单中的各指标数据值,训练并加载预训练的预测模型,分别选择预测通气功能和弥散功能所需的指标输入到对应的模型中进行预测,最后将诊断结论保存到新文件中,作为完整的诊断报告单。本发明采用SMOTE算法对少数类样本进行上采样,提升了诊断的准确率和模型的泛化能力。同时,通过在信息增益计算中引入正则化项,能够有效防止过拟合现象。
技术关键词
诊断预测系统
随机森林模型
指标
通气功能
诊断模块
数据
特征选择
线段
轮廓识别
输出模块
样本
识别PDF文件
报告
SMOTE算法
节点
坐标
黑色
图像