摘要
本申请提供了基于大模型的数据模型自动化提取方法及系统,涉及医疗信息技术领域,该方法包括:首先获取初始提示词和样本数据,对样本数据进行低秩稀疏联合分解得到稀疏残差及稀疏先验向量;将稀疏先验向量插入初始提示词形成增强提示词,利用大模型进行结构化提取得到样本结构化结果;基于稀疏残差与参考数据集生成核验结果,若存在错误则确定提示词调整方案,生成已调整提示词;迭代执行结构化提取、核验和调整步骤直至满足预设阈值。本申请能够自动完成数据模型的结构化定义,减少人工干预,提高数据提取准确性,实现数据的高效二次利用。