摘要
本发明提供一种数据集获取方法、系统、设备及介质,涉及数据交易技术领域,所述方法包括:获取目标订单数据集,目标订单数据集包括多个目标订单;根据多个目标订单生成目标数据字典,基于目标数据字典,生成多个模拟订单;通过机器学习模型分别确定各模拟订单对应的模拟订单成本;将各模拟订单成本分别输入价格预测模型,得到各模拟订单对应的模拟订单价格;根据各模拟订单及其分别对应的模拟订单成本和模拟订单价格确定模拟订单数据集,模拟订单数据集用于对预设定价模型进行训练。本发明为预设定价模型训练提供了可靠的样本数据,提升了预设定价模型的预测准确度。