基于时序差分学习与规则增强的大语言模型推理方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于时序差分学习与规则增强的大语言模型推理方法
申请号:CN202510409596
申请日期:2025-04-02
公开号:CN120409667A
公开日期:2025-08-01
类型:发明专利
摘要
本申请涉及自然语言处理和决策智能领域,尤其涉及一种基于时序差分学习与规则增强的大语言模型推理方法,该方法广泛应用于自动规划、智能问答、具身智能等场景。包括:任务轨迹采样、领域知识归纳、领域规则抽取以及基于规则增强的大语言模型推理:对于测试任务数据,基于向量检索匹配最相关的历史任务,并获取对应任务的领域规则集;通过大语言模型自身进行规则自然语言重写,使其更具可解释性和适应性;最终将优化后的规则集成到大语言模型推理提示文本中,以优化推理质量和稳定性。
技术关键词
大语言模型 轨迹 规则集 推理方法 语义 时序 自然语言 向量检索方法 决策 代表 计算方法 误差方法 文本 参数 场景 规划 关系 逻辑 数据 因子