基于思维链和排名学习的多任务信息抽取方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于思维链和排名学习的多任务信息抽取方法及装置
申请号:CN202510707182
申请日期:2025-05-29
公开号:CN120471050A
公开日期:2025-08-12
类型:发明专利
摘要
本发明提供一种基于思维链和排名学习的多任务信息抽取方法及装置,属于数据处理技术领域,所述方法包括:基于信息抽取任务需求,确定多个约束条件;将指令、思维链示例与目标文本进行拼接,作为输入数据;基于输入数据,对目标模型进行标准微调,得到微调目标模型;在微调目标模型上,以预设温度进行推理采样,生成中间数据集后,基于中间数据集,确定新的训练数据集;在新的训练数据集上,基于多个约束条件进行排名学习,得到优化目标模型;使用不同的预设温度进行推理采样,迭代训练优化目标模型,得到信息抽取模型;将待提取信息输入至信息抽取模型,得到信息抽取模型输出的信息提取结果。本发明降低了对标注数据的依赖,实现可控的优化。
技术关键词
信息抽取方法 信息抽取模型 多任务 实体 非暂态计算机可读存储介质 风格 标签 关系 处理器 文本 数据处理技术 语法结构 抽取装置 计算机程序产品 评价器 采样模块 指令 存储器