摘要
本发明提供一种模型训练方法、数据识别方法、装置及计算机程序产品,涉及数据处理技术领域,该方法包括:对多个初始表格中的每个初始表格进行采样,得到多个子表格,多个初始表格用于存储第一领域的数据;基于预设问题模板集合和多个子表格,生成N个第一问题以及N个第一问题中每个第一问题对应的第一答案;基于N个第一问题构建样本提示词集合,样本提示词集合包括N个提示词;基于每个第一问题对应的第一答案构建样本答案集合,样本答案集合包括N个第一答案;基于样本提示词集合和样本答案集合对初始大语言模型进行训练,得到第一模型,第一模型用于识别表格内的数据。本发明能提高对表格数据的识别准确率。