摘要
本发明属于自然语言处理领域,本发明公开了一种基于大模型微调的企业ip聊天系统构建方法,包括以下步骤:获取企业知识数据和闲聊对话数据,分别输入至第一大语言模型中,相应的生成企业知识问答数据集和闲聊对话问答数据集;将企业知识问答数据集和闲聊对话问答数据集输入至预训练的第二大语言模型中进行微调,在微调过程中,对第二大语言模型进行分层配置,并通过多个阶段对各个层的参数进行单独优化;本发明微调时对模型分层配置并分阶段单独优化各层参数,能够使得构建出的对话系统在对话能力上超越单纯的LoRA微调效果,同时在构建成本层面低于全量微调方案。