面向大语言模型的上下文感知层次指令学习方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
面向大语言模型的上下文感知层次指令学习方法及装置
申请号:CN202511153387
申请日期:2025-08-18
公开号:CN120705280B
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开一种面向大语言模型的上下文感知层次指令学习方法及装置,涉及人工智能技术领域。方法包括:对初始训练数据区分大语言模型的指令角色,根据指令角色构建训练数据;对训练数据中的指令角色构建指令角色标记,根据指令角色标记、指令段分割嵌入和指令段查询嵌入,确定指令段分割特征和指令段查询特征;将指令段分割特征、指令段查询特征以及Token嵌入特征输入上下文感知模块,得到样本输入数据;将样本输入数据输入大语言模型,对答复模型进行监督微调训练,得到训练好的答复模型;将待回复文本输入到训练好的答复模型中,得到对话回复数据。采用本发明,可以提升大语言模型对关键角色指令的执行优先程度,保证对话应用的安全性和稳定性。
技术关键词
指令学习方法 大语言模型 查询特征 嵌入特征 计算机可读取存储介质 数据 标记 计算机可读指令 样本 学习设备 学习装置 文本 交叉注意力机制 模块 融合特征 层级 人工智能技术 序列