一种煤矿机电设备领域稀疏样本的三元组抽取方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种煤矿机电设备领域稀疏样本的三元组抽取方法及装置
申请号:CN202510238055
申请日期:2025-02-28
公开号:CN120508662A
公开日期:2025-08-19
类型:发明专利
摘要
本申请提供一种煤矿机电设备领域稀疏样本的三元组抽取方法及装置,该方法包括:使用BERT模型作为训练模型进行文本向量化;在Span的抽取过程中使用Bi‑LSTM来融合Span上下文语义关系;通过关系分类器对候选的Span实体对进行关系分类;其中,在Span的抽取过程中使用滑动窗口机制,将每个实体表示为一个连续的子序列。本方法中,Span方法使用了滑动窗口机制,它将每个实体表示为一个连续的子序列,而不是单独的标记,可以有效的解决三元组重叠问题,在实体抽取和关系预测阶段使用Bi‑LSTM来融合Span的上下文语义,提升了对重叠三元组的识别效果,本方法对于领域内的关系类别增强与普通的同义词替换和回译法相比较也有更好的效果。
技术关键词
煤矿机电设备 滑动窗口机制 关系分类器 实体 BERT模型 三元组 文本 上下文语义信息 前馈神经网络 序列 抽取装置 样本 编码 注意力机制 处理器 同义词
系统为您推荐了相关专利信息
文本 动态知识图谱 词语 岗位匹配方法 语义关联度
大语言模型 校核方法 实体 文本段落 措施
数据商品推荐方法 文本 深度学习模型 矩阵 计算机程序代码
服务器系统 识别模块 时序分析方法 卷积神经网络提取 DBSCAN密度聚类
大倾角工作面 区域预测方法 算法模型 MeanShift聚类 工作面区域