一种大语言模型知识编辑方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种大语言模型知识编辑方法及系统
申请号:CN202510386461
申请日期:2025-03-31
公开号:CN119886073B
公开日期:2025-07-29
类型:发明专利
摘要
本发明公开了一种大语言模型知识编辑方法及系统,所述大语言模型知识编辑方法包括:对模型神经元的重要性进行评分,得到每个神经元的评分值;基于评分计算贡献值,并根据预设定的贡献阈值选择参与知识编辑的关键神经元集;将距离聚类中心最近的样本作为锚点样本,所有聚类内的实例共享一个基于锚点样本的更新向量进行第一阶段更新,对每个实例进行额外的个性化调整以进行第二阶段更新。本方法通过引入基于解释性的关键神经元识别,实现了对目标知识的精准定位,从而在大语言模型中进行知识编辑时提供了更高的准确性和效率。通过知识聚类和两阶段梯度更新的结合,有效降低了编辑过程中的计算开销,同时确保模型的稳定性和鲁棒性。
技术关键词
知识编辑方法 大语言模型 锚点 样本 聚类 非暂态计算机可读存储介质 编辑系统 处理器 两阶段 模块 存储器 鲁棒性 误差 键值 电子设备 度量 变量 动态