一种分层决策架构模型及其训练推理系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种分层决策架构模型及其训练推理系统及方法
申请号:CN202510859093
申请日期:2025-06-25
公开号:CN120875023A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种分层决策架构模型及其训练推理系统,它包括模型构建模块在大语言模型解码器层后添加与文本预测层并行的工具决策层;专用数据集制作模块根据通用数据集、大语言模型及三阶标记法制作专用数据集;混合监督训练模块冻结解码器层并联合训练文本预测层和工具决策层;动态推理控制模块控制推理迭代过程,将文本预测层输出拼接到输入文本后再次迭代,当工具决策层输出特定起始标记和终止标记时,暂停迭代,调用服务模块获取结果并拼接后继续迭代,直至输出结束符或达最大长度。本发明解决了大模型调用外部工具时决策冗余、响应延迟及扩展性差的问题,降低了训练成本、保持了语义精度、提升了决策效率、工具预测精度与扩展能力。
技术关键词
文本 推理系统 决策 分层 专用数据集 标记 大语言模型 解码器 训练工具 答案 制作专用 推理方法 计算机程序产品 控制模块 动态 编码器
系统为您推荐了相关专利信息
字幕 元素显示方法 视频帧 视觉 对象检测模型
生成方法 药物配伍禁忌 时序特征 风险 多头注意力机制
机器人路径规划方法 人工蜂群算法 强化学习算法 机器人路径规划系统 节点
字段 样本 数据处理指令 人工智能网络 数据处理网络
智能机器人 任务调度 深度神经网络模型 机器人状态信息 执行安全控制