多模型协同的企业实体混合识别方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模型协同的企业实体混合识别方法及装置
申请号:CN202511299643
申请日期:2025-09-12
公开号:CN120822521B
公开日期:2025-11-18
类型:发明专利
摘要
本申请涉及一种多模型协同的企业实体混合识别方法及装置,其包括对企业数据进行采集,获取企业原始数据,并对原始数据进行预处理,获取预处理数据;基于BERT‑BiLSTM‑CRF模型对文本主题指标集进行实体边界识别,输出实体候选标签,基于XGBoost模型对结构化特征集进行分类,输出实体类别概率,基于图神经网络对第三方量化特征集的实体关联关系推理,输出实体间关联权重;通过主题实体关联校验、ESG可信度修正及加权投票融合,生成包含实体名称、类别、关联关系及可信度评分的最终识别结果;基于最终识别结果及历史标注样本集,通过SMOTE算法对稀有实体类别进行过采样生成合成样本并更新训练集,迭代优化基础模型参数,输出优化后的多模型协同识别框架。
技术关键词
XGBoost模型 混合识别方法 多模型协同 CRF模型 SMOTE算法 非结构化文本 财务 标签 融合主题信息 样本 实体关联关系 企业 语义向量 数据 指标 训练集