基于熵项影响的生成对抗网络数据扩充方法及大语言模型

申请号：CN202510070668

申请日期：2025-01-16

公开号：CN119884753A

公开日期：2025-04-25

类型：发明专利

摘要

本发明公开一种基于熵项影响的生成对抗网络数据扩充方法及大语言模型，所述大语言模型包括大语言模块、多智能体模块、知识库与推理引擎及实时交互接口；大语言模型使用预训练语言模型作为主控，用于处理用户输入的自然语言理解与生成；多智能体模块部署由多个功能性智能体，用于各自独立完成特定任务；知识库与推理引擎存储有领域专用知识；实时交互接口用于提供用户与系统交互的入口。其中，基于熵项影响的生成对抗网络数据扩充方法进行数据扩充，然后输入到预训练语言模型进行训练。本发明提升了大预言模型在稀缺类别数据生成上的性能和数据分布模拟能力，同时实现了模块化、并行化的高效任务处理。

技术关键词

数据扩充方法多头注意力机制预训练语言模型解码器样本语言模块交叉注意力机制编码器自然语言理解特征权重学习生成对抗网络模型 Softmax函数大语言模型多智能体协同数据分布