一种用于非结构化检测文本的信息抽取方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种用于非结构化检测文本的信息抽取方法及装置
申请号:CN202511167960
申请日期:2025-08-20
公开号:CN120670589B
公开日期:2025-11-18
类型:发明专利
摘要
本发明提供一种用于非结构化检测文本的信息抽取方法装置,方法包括:获取待抽取的非结构化检测文本并进行预处理,获得检测文本序列;将检测文本序列输入至BERT模型进行深层语义编码,输出语义特征向量;将语义特征向量输入至SVM模型进行分类识别,从非结构化检测文本提取关键检测文本片段;将关键检测文本片段输入至LSTM‑CRF模型进行属性识别,输出检测文本属性信息;提取行业标准中相关的标准检测信息建立逻辑映射关系规则集,确定检测文本属性信息中各个信息元素之间的关联关系,形成信息关联规则集;根据信息关联规则集,构建检测事件信息链,该方法能够提高非结构化检测文本信息抽取的准确性。
技术关键词
文本 规则集 信息抽取方法 节点 词语 CRF模型 关系 PageRank算法 关键词 逻辑 语义 位置提取 序列 BERT模型 元素 抽取装置 编码器 编码模块