Long-RL:让强化学习应对超长序列任务的全新框架 2025年7月12日8时 作者 NLP工程化 Long-RL提供了一种新的框架来应对超长序列任务的强化学习训练,支持小时级长视频、多模态输入和图像/视频生成模型的强化学习。