数据增强方法及其装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
数据增强方法及其装置
申请号:CN202410804435
申请日期:2024-06-20
公开号:CN118708613A
公开日期:2024-09-27
类型:发明专利
摘要
本公开提供了数据增强方法及其装置,涉及数据处理技术领域,尤其涉及大数据、自然语言处理等技术领域。该方法包括:获取目标业务领域的第一文本数据,基于第一文本数据生成第一查询语句和第一结构化查询语句;对包含第一文本数据、第一查询语句和第一结构化查询语句的初始数据集进行多次数据增强,得到候选数据集,数据集中的文本数据、查询语句和结构化查询语句为三元组数据格式;判断候选数据集中是否具有未满足预设约束条件的待处理数据,响应于候选数据集中具有待处理数据,基于约束条件对待处理数据进行数据修改,得到目标数据集。本公开可以提高数据增强的效率和准确率,提升对应的数据质量,得到有效的结构化查询语句。
技术关键词
结构化查询语句 文本 三元组 信息更新 数据获取模块 数据格式 语义 数据处理技术 计算机程序产品 处理器通信 自然语言 指令 关系 可读存储介质 存储器