🔔科技频道[奇诺分享-ccino.org]⚡️
4 天前
机器之心
DanceGRPO:首个统一视觉生成的强化学习框架
Telegraph
|
原文
Telegraph
DanceGRPO:首个统一视觉生成的强化学习框架 - 机器之心
本文由字节跳动 Seed 和香港大学联合完成。第一作者薛泽岳为香港大学 MMLab@HKU 在读博士生,在 CVPR、NeurIPS 等国际顶级会议上发表多篇研究成果。项目通讯作者为黄伟林博士和罗平教授。 R1 横空出世,带火了 GRPO 算法,RL 也随之成为 2025 年的热门技术探索方向,近期,字节 Seed 团队就在图像生成方向进行了相关探索。 现在,我们推出名为 DanceGRPO 的创新框架,这是首个旨在统一视觉生成强化学习的解决方案,实现了单一强化学习算法在两大生成范式(diffusion/rectified…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia