基于时序差分学习与规则增强的大语言模型推理方法

申请号：CN202510409596

申请日期：2025-04-02

公开号：CN120409667A

公开日期：2025-08-01

类型：发明专利

摘要

本申请涉及自然语言处理和决策智能领域，尤其涉及一种基于时序差分学习与规则增强的大语言模型推理方法，该方法广泛应用于自动规划、智能问答、具身智能等场景。包括：任务轨迹采样、领域知识归纳、领域规则抽取以及基于规则增强的大语言模型推理：对于测试任务数据，基于向量检索匹配最相关的历史任务，并获取对应任务的领域规则集；通过大语言模型自身进行规则自然语言重写，使其更具可解释性和适应性；最终将优化后的规则集成到大语言模型推理提示文本中，以优化推理质量和稳定性。

技术关键词

大语言模型轨迹规则集推理方法语义时序自然语言向量检索方法决策代表计算方法误差方法文本参数场景规划关系逻辑数据因子