一种SQL数据集生成方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种SQL数据集生成方法及装置
申请号:CN202511443137
申请日期:2025-10-10
公开号:CN120910080A
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种SQL数据集生成方法及装置,涉及人工智能技术领域。所述方法包括:对文本数据进行信息提取处理,得到包括复杂度分布、业务规则以及查询模式的结构化文本数据;基于结构化文本数据,构建多个候选问答对;针对每个候选问答对,基于候选SQL语句在执行维度、匹配维度以及语法维度上的维度得分以及候选问题的复杂级别,计算第一质量得分;计算候选SQL语句在文本单元以及子句层级上的置信度,得到第二质量得分;融合第一质量得分以及第二质量得分,确定目标SQL数据集。本发明可确保快速生成高质量的目标SQL数据集。
技术关键词
文本 语句 数据库结构 大语言模型 复杂度 清洗规则 生成方法 语法结构 层级 模式 模板组合 人工智能技术 因子 生成装置 策略 模块 格式 基础