摘要
本发明公开了一种基于大数据的金融风险分析方法,所属领域为金融风险分析领域,包括:根据数据格式和时间粒度的差异,通过归一化处理将不同数据源的数据转换为统一标准,得到标准化数据集;在实时数据流中,通过自适应算法判断数据分布的变化趋势,针对高维数据的复杂性,采用主成分分析技术从多维度特征中提取关键特征,降低数据维度;在稀疏特征中,通过特征选择算法判断特征的重要性,若特征出现频率低于预设阈值,则剔除无效特征;根据提取的关键特征和过滤后的稀疏特征,采用随机森林算法构建信用风险评估模型,训练模型预测风险概率;根据最终训练结果,确定最优模型参数和特征组合,生成风险预测报告。