基于熵项影响的生成对抗网络数据扩充方法及大语言模型
申请号:CN202510070668
申请日期:2025-01-16
公开号:CN119884753A
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开一种基于熵项影响的生成对抗网络数据扩充方法及大语言模型,所述大语言模型包括大语言模块、多智能体模块、知识库与推理引擎及实时交互接口;大语言模型使用预训练语言模型作为主控,用于处理用户输入的自然语言理解与生成;多智能体模块部署由多个功能性智能体,用于各自独立完成特定任务;知识库与推理引擎存储有领域专用知识;实时交互接口用于提供用户与系统交互的入口。其中,基于熵项影响的生成对抗网络数据扩充方法进行数据扩充,然后输入到预训练语言模型进行训练。本发明提升了大预言模型在稀缺类别数据生成上的性能和数据分布模拟能力,同时实现了模块化、并行化的高效任务处理。
技术关键词
数据扩充方法
多头注意力机制
预训练语言模型
解码器
样本
语言模块
交叉注意力机制
编码器
自然语言理解
特征权重学习
生成对抗网络模型
Softmax函数
大语言模型
多智能体协同
数据分布