基于思维链和排名学习的多任务信息抽取方法及装置

申请号：CN202510707182

申请日期：2025-05-29

公开号：CN120471050A

公开日期：2025-08-12

类型：发明专利

摘要

本发明提供一种基于思维链和排名学习的多任务信息抽取方法及装置，属于数据处理技术领域，所述方法包括：基于信息抽取任务需求，确定多个约束条件；将指令、思维链示例与目标文本进行拼接，作为输入数据；基于输入数据，对目标模型进行标准微调，得到微调目标模型；在微调目标模型上，以预设温度进行推理采样，生成中间数据集后，基于中间数据集，确定新的训练数据集；在新的训练数据集上，基于多个约束条件进行排名学习，得到优化目标模型；使用不同的预设温度进行推理采样，迭代训练优化目标模型，得到信息抽取模型；将待提取信息输入至信息抽取模型，得到信息抽取模型输出的信息提取结果。本发明降低了对标注数据的依赖，实现可控的优化。

技术关键词

信息抽取方法信息抽取模型多任务实体非暂态计算机可读存储介质风格标签关系处理器文本数据处理技术语法结构抽取装置计算机程序产品评价器采样模块指令存储器