摘要
本发明公开了一种分层决策架构模型及其训练推理系统,它包括模型构建模块在大语言模型解码器层后添加与文本预测层并行的工具决策层;专用数据集制作模块根据通用数据集、大语言模型及三阶标记法制作专用数据集;混合监督训练模块冻结解码器层并联合训练文本预测层和工具决策层;动态推理控制模块控制推理迭代过程,将文本预测层输出拼接到输入文本后再次迭代,当工具决策层输出特定起始标记和终止标记时,暂停迭代,调用服务模块获取结果并拼接后继续迭代,直至输出结束符或达最大长度。本发明解决了大模型调用外部工具时决策冗余、响应延迟及扩展性差的问题,降低了训练成本、保持了语义精度、提升了决策效率、工具预测精度与扩展能力。