详解vLLM和SGLang awq dequantize kernel的魔法 上午8时 2025/03/17 作者 GiantPandaCV kernel触发条件为当输入x的shape的tokens<256时,这个时候会先把int4的awq权