摘要
本发明公开了一种基于强化学习优化的痤疮药物配方生产方法,包括如下步骤:S1、构建因果关系网络,筛选出关键变量;S2、采用自适应层次化强化学习算法优化痤疮药物配方方案和工艺参数,输出优化参数集合;S3、定义双层奖励函数,并结合自适应动态权重调整机制,输出综合优化方向;S4、构建多尺度纳米颗粒动力学仿真模型,生成稳定性因子;S5、将稳定性因子和综合优化方向输入改进的DCGAN网络,生成优化样本集合,并对生成的优化样本进行筛选;S6、更新自适应层次化强化学习算法的参数,优化配方方案和工艺参数。本发明结合因果模型、强化学习、多尺度仿真和生成对抗网络,优化痤疮药物配方及工艺参数,具备高效、精准、动态适应与多目标平衡的优点。