摘要
本发明涉及基于深度强化学习的数据产品动态定价方法及系统,属数据产品动态定价、数据交易平台和计算机领域。方法包括:初始化定价环境;构建基于深度强化学习的数据产品动态定价模型;训练数据产品动态定价模型,优化参数并更新模型的权重;利用经过训练的模型对数据产品进行动态定价;四个步骤通过环境处理模块、模型构建模块、训练模块、定价输出模块构成动态定价系统;本发明解决了深度强化学习Deep Q‑Network算法中“探索”与“利用”平衡和经验样本利用效率低的问题,提升数据产品动态定价性能,间接辅助实现数据产品累积收益的最大化。