一种结合关键词指导与大语言模型近端策略优化的关键句抽取方法
申请号:CN202510238007
申请日期:2025-02-28
公开号:CN120509402A
公开日期:2025-08-19
类型:发明专利
摘要
本申请提供一种结合关键词指导与大语言模型近端策略优化的关键句抽取方法,包括:构建关键词‑关键句对;利用联合匹配模型评估其相关度,生成奖励值;引入KL散度衡量训练模型与参考模型之间的差异,结合状态价值网络对当前状态的价值分数进行估计;通过近端策略优化指导模型,实现关键句的抽取。本申请实施例的方法,构建关键词‑关键句对,利用联合匹配模型评估其相关度,生成奖励值,引入KL散度衡量训练模型与参考模型之间的差异,结合状态价值网络对当前状态的价值分数进行估计,通过近端策略优化指导模型,实现关键句的抽取,在很大程度上解决了对标注数据依赖性强以及大语言模型训练成本高的问题,显著提升了关键句抽取的效果。
技术关键词
关键词
网络
BERT模型
时序
大语言模型
抽取装置
处理器
控制策略
误差
可读存储介质
文本
模块
存储器
定义
电子设备
比率
计算机
因子
程序