AirLLM:低内存硬件的颠覆性分层推理技术,引领AI性能新高度 下午2时 2025/01/23 作者 AI技术研习社 分层推理技术让超大规模语言模型在有限内存设备上运行成为可能,AirLLM 提供了简便的框架实现这一目标。