一种轻量化模型的更新方法、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种轻量化模型的更新方法、设备及介质
申请号:CN202510711985
申请日期:2025-05-29
公开号:CN120874908A
公开日期:2025-10-31
类型:发明专利
摘要
本公开涉及神经网络模型技术领域,特别是一种轻量化模型的更新方法、设备及介质,方法包括:对Transformer模型进行更新,出现错误输出时,判断该错误输出的错误类型是否存在对应的错误标记:若不存在,对该错误类型生成错误标记,并冻结Transformer模型的参数,在Transformer模型的最后一层前馈神经网络层设置错误类型对应的补丁;若存在,令Transformer模型的最后一层前馈神经网络层中的补丁生效;所述补丁生效时,对错误输出进行调整,使得输出正确。本公开在不重新训练整个模型的情况下,通过补丁改变模型输出,纠正模型中的错误信息或过时知识。保证模型只修正错误输入,对其他输入没有影响,最后结合延迟半径建立密码本,可以在模型运行过程不断扩充错误类型。
技术关键词
模型更新方法 补丁 神经网络模型技术 条目 数据处理单元 标签 数据存储单元 解码器 标记 编码器 动态 记忆 可读存储介质 计算机 参数 样本 注意力 电子设备