摘要
本发明公开了一种基于级联框架的水利数值上下文信息抽取方法,由模型编码器对输入水利领域文本开展预处理操作,以此获取语义表示;可同步启动数值标记器与单位和修饰词提取器;其中,数值标记器负责对输入水利领域文本加以分析,以识别其中潜在的数值;单位和修饰词提取器则用于识别数值对应的单位和修饰词;对象及关系标记器在数值标记器完成工作之后介入,对象标记器利用序列标注方法,识别出数值有关的实体、属性等上下文信息,关系标记器通过基于双向问答的跨度预测系统,确定对象之间的关系分类。本发明通过级联多个关键部件来实现数值上下文信息的精准抽取,为水利领域信息化建设提供新的方法。