摘要
本公开提供了基于大模型的样本数据确定方法、装置和存储介质,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、大模型等技术领域。具体实现方案为:获取时间推理任务下的样本问题、所述样本问题的多个参考文本和答案生成规则;根据大模型、所述答案生成规则、所述多个参考文本以及所述多个参考文本各自的第一发表时间,确定所述样本问题的第一答案;根据所述样本问题和所述第一答案,生成用于训练时间推理模型的样本答案对集合。由此,结合大模型、样本问题、回答生成规则和多个参考文本,可以准确得到样本问题的回答,从而无需人工来确定样本问题的回答,降低了模型训练成本。