一种分层决策架构模型及其训练推理系统及方法

申请号：CN202510859093

申请日期：2025-06-25

公开号：CN120875023A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种分层决策架构模型及其训练推理系统，它包括模型构建模块在大语言模型解码器层后添加与文本预测层并行的工具决策层；专用数据集制作模块根据通用数据集、大语言模型及三阶标记法制作专用数据集；混合监督训练模块冻结解码器层并联合训练文本预测层和工具决策层；动态推理控制模块控制推理迭代过程，将文本预测层输出拼接到输入文本后再次迭代，当工具决策层输出特定起始标记和终止标记时，暂停迭代，调用服务模块获取结果并拼接后继续迭代，直至输出结束符或达最大长度。本发明解决了大模型调用外部工具时决策冗余、响应延迟及扩展性差的问题，降低了训练成本、保持了语义精度、提升了决策效率、工具预测精度与扩展能力。

技术关键词

文本推理系统决策分层专用数据集标记大语言模型解码器训练工具答案制作专用推理方法计算机程序产品控制模块动态编码器

系统为您推荐了相关专利信息

视频图形元素显示方法和装置

字幕元素显示方法视频帧视觉对象检测模型

一种医疗大模型驱动的跨科室协同处方生成方法及系统

生成方法药物配伍禁忌时序特征风险多头注意力机制

基于人工蜂群和强化学习的机器人路径规划方法和系统

机器人路径规划方法人工蜂群算法强化学习算法机器人路径规划系统节点

一种病原体的快速检测方法及系统

字段样本数据处理指令人工智能网络数据处理网络

一种智能机器人上下料方法及系统

智能机器人任务调度深度神经网络模型机器人状态信息执行安全控制