基于标签不变性的上下文数据增强方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于标签不变性的上下文数据增强方法
申请号:
CN202411508236
申请日期:
2024-10-28
公开号:
CN119598977A
公开日期:
2025-03-11
类型:
发明专利
摘要
本发明公开基于标签不变性的上下文数据增强方法,属于自然语言处理技术领域。该方法包括:步骤S1、对输入的原始文本进行id映射,再进行随机顺序打乱,并选择指定数量的字符,作为后续进行数据增强的目标文本;步骤S2、利用改变嵌入层向量的Bert模型和双向LSTM模型,对目标文本执行保留分类标签信息的文本编码处理和上下文特征提取;步骤S3、将提取出的特征向量分别经池化操作、自编码器和去噪自编码器进行变换并进行拼接,通过反向解码生成增强文本作为输出。
技术关键词
编码器
文本
标签
字符
数据
BiLSTM模型
处理单元
可读存储介质
解码
神经网络模型
噪声
电子设备
自然语言
处理器
同义词
标记
语义
存储器