面向大语言模型的上下文感知层次指令学习方法及装置

申请号：CN202511153387

申请日期：2025-08-18

公开号：CN120705280B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开一种面向大语言模型的上下文感知层次指令学习方法及装置，涉及人工智能技术领域。方法包括：对初始训练数据区分大语言模型的指令角色，根据指令角色构建训练数据；对训练数据中的指令角色构建指令角色标记，根据指令角色标记、指令段分割嵌入和指令段查询嵌入，确定指令段分割特征和指令段查询特征；将指令段分割特征、指令段查询特征以及Token嵌入特征输入上下文感知模块，得到样本输入数据；将样本输入数据输入大语言模型，对答复模型进行监督微调训练，得到训练好的答复模型；将待回复文本输入到训练好的答复模型中，得到对话回复数据。采用本发明，可以提升大语言模型对关键角色指令的执行优先程度，保证对话应用的安全性和稳定性。

技术关键词

指令学习方法大语言模型查询特征嵌入特征计算机可读取存储介质数据标记计算机可读指令样本学习设备学习装置文本交叉注意力机制模块融合特征层级人工智能技术序列