Cosmos-RL:专为物理AI应用打造的灵活可扩展强化学习框架 2025年7月1日8时 作者 NLP工程化 Cosmos-RL 是一个为物理AI应用设计的灵活可扩展强化学习框架,支持大规模训练、集成HuggingFace模型和低精度训练等特性。