摘要
本发明公开了一种基于领域知识增强的产业链大模型构建方法及系统。首先,基于通用预训练大模型,利用产业链文本数据进行领域持续预训练,形成产业链大模型基座;其次,通过生成文档解读、企业人才画像、产业链图认知三类任务的指令‑响应问答对,结合通用问答数据集对产业链大模型基座进行多任务微调和领域偏好优化,使模型具备产业链问题专精能力;最后,针对企业人才画像任务,引入外部知识库的关键词检索结果作为上下文,构建检索增强数据集进行二次微调,最终获得兼具产业链知识深度与外部信息整合能力的垂直领域大模型。该方法通过持续预训练、指令微调、偏好优化和检索增强等技术手段,实现了从通用大模型到产业链专用模型的精准转化。