强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B 下午11时 2025/05/27 作者 机器之心 阿里巴巴团队提出QwenLong-L1框架解决长短上下文推理强化学习问题,显著提升长文档问答任务性能,超越OpenAI等旗舰模型。