高效通用归档

普林斯顿大学联合北京大学合作开发了名为 ReasonFlux 的多层次LLM 推理框架

上午8时 2025/02/14 作者 NLP工程化

基于层次化强化学习，ReasonFlux 提出一种更高效且通用的大模型推理范式，核心在于结构化的思维模板，结合层次化推理和强可解释性，仅 32B 参数，使用 8 块 NVIDIA A100-PCIE-80GB GPU，能通过自动扩展思维模板提升推理能力。