摘要
本发明公开了一种面向一致性学习的样本增强与优化方法,包括:对非结构化文本中的专业知识资料、专业词汇解读、历史实践数据与专家经验集合分别进行知识抽取,得到原始问答对,得到专业知识库;通过多样化策略处理原始问答对,生成语义一致但形式多样的增强样本问答对,对增强样本问答对进行扩展或简化,得到正样本;在增强样本问答对中引入干扰性表述或事实错误,得到负样本;根据大模型准确率调整正负样本比例;将正样本和负样本作为训练数据,并基于预训练大模型和专业知识库进行参数微调得到专业大模型。本发明提升了大模型在不同场景下的适应性和鲁棒性,降低了无关信息与错误回答的出现概率。