基于数据驱动正则的问答大语言模型的问答方法及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于数据驱动正则的问答大语言模型的问答方法及产品
申请号:CN202510828333
申请日期:2025-06-20
公开号:CN120336497B
公开日期:2025-10-28
类型:发明专利
摘要
本申请涉及人工智能技术领域,公开了一种基于数据驱动正则的问答大语言模型的问答方法及产品。该方法包括:获取待部署目标问答大语言模型的目标设备的设备参数值,确定预训练的原始问答大语言模型的需要剪枝的通道;基于问答样本数据,利用带有正则损失项的损失函数对预训练的原始问答大语言模型进行模型参数更新;按照需要剪枝的通道对经过模型参数更新后的问答大语言模型进行通道剪枝,基于经过通道剪枝后的问答大语言模型得到目标问答大语言模型;针对来自于目标设备的问题,通过目标问答大语言模型进行推理,得到答案。采用本方法能够在减少大语言模型的规模的同时保持模型性能,便于将大语言模型部署到轻量级设备。
技术关键词
大语言模型 通道剪枝 矩阵 问答方法 答案 注意力机制 参数 索引 数据 样本 前馈神经网络 代表 表达式 元素 模块 人工智能技术 问答系统 客户端