摘要
本申请涉及一种多模型协同的企业实体混合识别方法及装置,其包括对企业数据进行采集,获取企业原始数据,并对原始数据进行预处理,获取预处理数据;基于BERT‑BiLSTM‑CRF模型对文本主题指标集进行实体边界识别,输出实体候选标签,基于XGBoost模型对结构化特征集进行分类,输出实体类别概率,基于图神经网络对第三方量化特征集的实体关联关系推理,输出实体间关联权重;通过主题实体关联校验、ESG可信度修正及加权投票融合,生成包含实体名称、类别、关联关系及可信度评分的最终识别结果;基于最终识别结果及历史标注样本集,通过SMOTE算法对稀有实体类别进行过采样生成合成样本并更新训练集,迭代优化基础模型参数,输出优化后的多模型协同识别框架。