详解vLLM和SGLang awq dequantize kernel的魔法 2025年3月17日8时 作者 GiantPandaCV kernel触发条件为当输入x的shape的tokens<256时,这个时候会先把int4的awq权