一种场景和版本适配的数据处理合规风险知识库构建方法
申请号:CN202510110708
申请日期:2025-01-23
公开号:CN120086351A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种场景和版本适配的数据处理合规风险知识库构建方法,包括:收集不同行业的规章制度以及平台架构信息,构建规章制度集和平台架构集;对规章制度集和平台架构集进行数据增强处理;利用大语言模型对增强后的规章制度集和平台架构集进行信息提取,得到规章制度和平台架构中的实体及关系;基于规章制度和平台架构中的实体及关系构建实体关联数据集;利用实体关联数据集和开源数据集对预训练模型进行微调,得到定制化大模型,以便于利用所述定制化大模型获得特定行业的规章制度和平台架构的实体关联,从而实现该特定行业知识库的构建。该方法能够减少对历史数据的依赖,具备灵活的自适应能力,同时,减少了人工干预,提高了自动化程度。
技术关键词
知识库构建方法
实体
平台
大语言模型
预训练模型
场景
风险
行业白皮书
关系
数据收集模块
通信接口
翻译技术
可读存储介质
生成脚本
开源项目
存储器
处理器
同义词
解析器