Long-RL框架归档 - 每时AI

Long-RL：让强化学习应对超长序列任务的全新框架

2025年7月12日8时作者 NLP工程化

Long-RL提供了一种新的框架来应对超长序列任务的强化学习训练，支持小时级长视频、多模态输入和图像/视频生成模型的强化学习。