普林斯顿大学联合北京大学合作开发了名为 ReasonFlux 的多层次LLM 推理框架

基于层次化强化学习,ReasonFlux 提出一种更高效且通用的大模型推理范式,核心在于结构化的思维模板,结合层次化推理和强可解释性,仅 32B 参数,使用 8 块 NVIDIA A100-PCIE-80GB GPU,能通过自动扩展思维模板提升推理能力。