主体名称分类及其模型训练方法、计算机设备及存储介质
申请号:CN202411595654
申请日期:2024-11-11
公开号:CN119128161B
公开日期:2025-02-25
类型:发明专利
摘要
本申请揭示一种主体名称分类及其模型训练方法、计算机设备及存储介质,该方法包括:对多类原始主体名称数据进行抽样,得到主体名称样本数据集;对主体名称样本数据集进行数据清洗,得到主体名称标准数据集;对主体名称标准数据集进行分词处理,得到初始主体名称词汇列表;对初始主体名称词汇列表进行交叉关键词剔除处理,得到目标主体名称词汇列表;提取目标主体名称词汇列表中每个目标主体名称词汇的嵌入特征,得到嵌入特征集;以预设的集成模型框架,基于嵌入特征集进行训练,得到主体名称分类模型,能够有效提升主体名称分类模型的准确性,从而有利于在风险管理、合规管理、展业获客、数据治理等方面进行数据管理和分析。
技术关键词
分类模型训练方法
嵌入特征
列表
关键词
有向无环图
样本
分类方法
计算机设备
动态规划算法
网络结构
构建词典
游走模型
可读存储介质
分词
训练集
处理器
数据管理
图谱