摘要
本发明公开了一种基于模型强化学习的区块链分片策略优化方法,涉及区块链分片技术领域。获取区块链的当前状态数据,并将当前状态数据输入至初始策略网络中,得到区块链的行为数据;并根据区块链的行为数据对区块链进行状态转移,得到区块链在下一时刻的状态数据;然后获取预测模型的初始状态数据,并将所述初始状态数据输入至交叉熵算法中,得到区块链的最优行为轨迹;从最优行为轨迹中获取初始状态行为对,并通过初始状态行为对训练初始策略网络,得到最优策略网络;最优策略网络用于生成待分片区块链的最优分片策略。该方法能够提高了在学习区块链的最优分片策略时的采样效率,从而提高了区块链的吞吐量。