基于标签不变性的上下文数据增强方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于标签不变性的上下文数据增强方法
申请号:CN202411508236
申请日期:2024-10-28
公开号:CN119598977A
公开日期:2025-03-11
类型:发明专利
摘要
本发明公开基于标签不变性的上下文数据增强方法,属于自然语言处理技术领域。该方法包括:步骤S1、对输入的原始文本进行id映射,再进行随机顺序打乱,并选择指定数量的字符,作为后续进行数据增强的目标文本;步骤S2、利用改变嵌入层向量的Bert模型和双向LSTM模型,对目标文本执行保留分类标签信息的文本编码处理和上下文特征提取;步骤S3、将提取出的特征向量分别经池化操作、自编码器和去噪自编码器进行变换并进行拼接,通过反向解码生成增强文本作为输出。
技术关键词
编码器 文本 标签 字符 数据 BiLSTM模型 处理单元 可读存储介质 解码 神经网络模型 噪声 电子设备 自然语言 处理器 同义词 标记 语义 存储器