训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO 训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO 关键词: AI,模型训练,MixGRPO,MixGRPO-Flash 图像生成不光要好看,更要高效。 混元基础模型团队提出全新框架MixGRPO,该框架通过结合随机微分方程(SDE)和常微分方程(ODE),利用混合采样策略的灵活性,简化了MDP中的优化流程,从而提升了效率的同时还增强了性能。 来自主题: AI技术研报 5922 点击 2025-08-03 13:37