一种基于渐进起草树的大语言模型推理加速方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于渐进起草树的大语言模型推理加速方法及系统
申请号:CN202510804204
申请日期:2025-06-17
公开号:CN120654833A
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开了一种基于渐进起草树的大语言模型推理加速方法及系统,所述方法包括:构建初始起草树,初始起草树的根节点关联已解码的上下文序列,其余节点通过随机初始化生成扰动词元;基于节点之间的依赖关系设置注意力掩码和位置编码,使得每个节点仅能关注其所在路径上的前序节点;利用大语言模型对初始起草树进行推理,生成草稿词元,并根据草稿词元扩展起草树及更新候选池;通过预设宽度约束和深度约束对扩展后的起草树进行剪枝;从候选池中提取候选草稿树。本发明通过将传统自回归的单步预测任务转化为并行的起草和验证过程,提出基于渐进起草树的草稿生成机制,在保持原始的模型架构和参数的情况下实现了高效的推理加速。
技术关键词
节点 大语言模型 非暂态计算机可读存储介质 注意力 加速系统 生成机制 处理器 有效性 解码 关系 编码 序列 语义 模块 存储器 电子设备 层级 规模 程序 参数
系统为您推荐了相关专利信息
大数据日志分析 差分隐私技术 多尺度特征融合 跨用户 节点
监测点 拓扑网络 注意力 时空大数据 时空序列数据
键值 语义 大语言模型 文本处理方法 文本处理装置
语义 交叉点 对齐模块 分支 注意力
电池单元 矩阵 功率分配方法 电池组 子系统