摘要
本发明公开了一种基于大语言模型的表格问答数据生成方法、设备、介质,包括:获取表格问答数据集作为种子数据集;针对表格数据生成的每次迭代,从种子数据集中采样一表格数据;将该表格数据以及问题改写方向填入提示词模板,通过大语言模型改写该表格数据的原始问题,得到改写问题;对表格数据进行采样或扩增;将改写问题以及经采样或扩增后的表格数据输入至大语言模型中生成模型响应,将该模型响应作为改写问题对应的改写答案;对改写答案进行质量检验;将通过质量检验的改写答案以及改写问题作为更新的表格数据;对更新的表格数据进行增强,将增强后的表格数据添加至下一次迭代的种子数据集中,经迭代得到表格问答数据生成结果。