摘要
本发明公开了一种不可迁移的模型迁移方法,涉及人工智能技术领域,包括初始化参数、确定超参数集合、数据收集与计算、策略与价值更新、计算LMMD度量以及调整策略与价值函数等步骤。通过PPO算法优化策略参数,从而实现更高效、更智能的决策,通过引入LMMD度量,本发明能够准确地衡量源域和目标域之间的差异,从而根据差异程度调整策略和价值函数,降低模型在目标域中的表现。这样模型可以自动识别不安全的环境,在模型封装好之后,让模型的可用性更强,不可复制性更强,通过授信可控迁移方案,模型可以在不同的应用场景中更有效地适应和优化。在授信环境下,用户可以方便地使用模型,提高了模型迁移的灵活性和适应性。