摘要
本申请公开了一种引入注意力机制的文本样本均衡化处理方法及系统,涉及数据均衡化处理领域,其方法包括:接收文本样本集,对文本样本集进行特征提取,得到向量矩阵;将文本样本集输入Transformer网络结构,得到注意力输出值,Transformer网络结构包括多头注意力机制;根据注意力输出值与向量矩阵,对每个文本样本进行重要性评估,得到重要性评分;对重要性评分小于预设阈值的文本样本进行文本增强,并更新文本样本集;在更新后的文本样本集中添加对抗样本,得到新文本样本集;采用自适应采样策略调整每个样本类别的样本数量,得到用于表示文本样本集的最终文本样本集。本申请可以均衡化文本样本,有效提高模型的整体性能。