摘要
本发明提供一种基于思维链和排名学习的多任务信息抽取方法及装置,属于数据处理技术领域,所述方法包括:基于信息抽取任务需求,确定多个约束条件;将指令、思维链示例与目标文本进行拼接,作为输入数据;基于输入数据,对目标模型进行标准微调,得到微调目标模型;在微调目标模型上,以预设温度进行推理采样,生成中间数据集后,基于中间数据集,确定新的训练数据集;在新的训练数据集上,基于多个约束条件进行排名学习,得到优化目标模型;使用不同的预设温度进行推理采样,迭代训练优化目标模型,得到信息抽取模型;将待提取信息输入至信息抽取模型,得到信息抽取模型输出的信息提取结果。本发明降低了对标注数据的依赖,实现可控的优化。