DanceGRPO:首个统一视觉生成的强化学习框架 DanceGRPO:首个统一视觉生成的强化学习框架 关键词: AI,AI视频,模型训练,DanceGRPO R1 横空出世,带火了 GRPO 算法,RL 也随之成为 2025 年的热门技术探索方向,近期,字节 Seed 团队就在图像生成方向进行了相关探索。 来自主题: AI技术研报 6807 点击 2025-05-15 10:47