告别传统强化学习?上下文强化学习基座模型 OmniRL 让 AI “自学成才” 下午11时 2025/02/11 作者 AI科技大本营 近日,香港中文大学AIRS团队提出OmniRL模型,通过大规模元训练和上下文强化学习方法解决AI泛化能力问题,实现从‘环境适应’走向‘能力泛化’的突破。