一种基于大语言模型先验知识的推理状态控制方法及装置

申请号：CN202410851175

申请日期：2024-06-28

公开号：CN118446322B

公开日期：2025-02-11

类型：发明专利

摘要

本发明涉及数据处理技术领域，特别是指一种基于大语言模型先验知识的推理状态控制方法及装置，该方法应用于自动驾驶离散化导航问题、集装箱堆叠问题、货物码放问题和自然语言文本下的文字数值计算问题，方法包括：获取无人系统决策推理的样本数据集；使用样本数据集、以及由ATE因果效应估计算法与交叉熵组成的损失函数，对初始的大语言模型进行训练；获取长程行动决策问题，构建因果概率树，确定剪枝和展开方向的优化问题，进而将长程行动决策问题切分为多个短程行动决策问题；使用训练好的大语言决策推理模型对多个短程行动决策问题进行求解，进而完成行动。采用本发明，可以解决大语言模型在长程推理任务中因果幻觉的问题，提高了推理的准确性。

技术关键词

集装箱堆叠自然语言文本样本大语言模型状态控制方法估计算法状态控制装置决策计算机可读取存储介质状态控制设备坐标计算机可读指令答案效应数据格式定义数据处理技术