极客说|Phi-4 模型的 4 位量化与 vLLM 高速推理 下午4时 2025/01/21 作者 AIGC开放社区 Phi-4 是微软最新发布的大型语言模型,参数量为140亿。本文详细介绍了其架构特点及训练策略,并展示了如何在本地环境中对其进行量化优化。