一种基于模型强化学习的区块链分片策略优化方法

申请号：CN202411437115

申请日期：2024-10-15

公开号：CN119383192B

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了一种基于模型强化学习的区块链分片策略优化方法，涉及区块链分片技术领域。获取区块链的当前状态数据，并将当前状态数据输入至初始策略网络中，得到区块链的行为数据；并根据区块链的行为数据对区块链进行状态转移，得到区块链在下一时刻的状态数据；然后获取预测模型的初始状态数据，并将所述初始状态数据输入至交叉熵算法中，得到区块链的最优行为轨迹；从最优行为轨迹中获取初始状态行为对，并通过初始状态行为对训练初始策略网络，得到最优策略网络；最优策略网络用于生成待分片区块链的最优分片策略。该方法能够提高了在学习区块链的最优分片策略时的采样效率，从而提高了区块链的吞吐量。

技术关键词

交叉熵算法数据分片策略轨迹网络区块链分片技术节点