摘要
本公开提供了数据增强方法及其装置,涉及数据处理技术领域,尤其涉及大数据、自然语言处理等技术领域。该方法包括:获取目标业务领域的第一文本数据,基于第一文本数据生成第一查询语句和第一结构化查询语句;对包含第一文本数据、第一查询语句和第一结构化查询语句的初始数据集进行多次数据增强,得到候选数据集,数据集中的文本数据、查询语句和结构化查询语句为三元组数据格式;判断候选数据集中是否具有未满足预设约束条件的待处理数据,响应于候选数据集中具有待处理数据,基于约束条件对待处理数据进行数据修改,得到目标数据集。本公开可以提高数据增强的效率和准确率,提升对应的数据质量,得到有效的结构化查询语句。