一种引入注意力机制的文本样本均衡化处理方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种引入注意力机制的文本样本均衡化处理方法及系统
申请号:CN202411921647
申请日期:2024-12-25
公开号:CN119862881A
公开日期:2025-04-22
类型:发明专利
摘要
本申请公开了一种引入注意力机制的文本样本均衡化处理方法及系统,涉及数据均衡化处理领域,其方法包括:接收文本样本集,对文本样本集进行特征提取,得到向量矩阵;将文本样本集输入Transformer网络结构,得到注意力输出值,Transformer网络结构包括多头注意力机制;根据注意力输出值与向量矩阵,对每个文本样本进行重要性评估,得到重要性评分;对重要性评分小于预设阈值的文本样本进行文本增强,并更新文本样本集;在更新后的文本样本集中添加对抗样本,得到新文本样本集;采用自适应采样策略调整每个样本类别的样本数量,得到用于表示文本样本集的最终文本样本集。本申请可以均衡化文本样本,有效提高模型的整体性能。
技术关键词
样本 文本 引入注意力机制 多头注意力机制 网络结构 前馈神经网络 机器可读存储介质 依存句法分析 同义词 矩阵 序列 插值算法 指令 策略 分类器 存储器 图谱
系统为您推荐了相关专利信息
人工智能大数据 画像 智慧健康管理系统 身体 生成提示信息
临床检验数据 医学影像数据 医学知识图谱 电子病历 个性化特征
信息自动提取方法 冰水 影像 数据 序列
半导体封装材料 缺陷检测方法 像素点 轮廓信息 累积分布函数
对象 画像 兴趣 队列 参数