MetaShuffling:Meta的Fused MoE kernel工程方案,更激进的Kernel优化和尽量避免Padding 下午2时 2025/06/06 作者 GiantPandaCV lerating-llama-4-moe-inference/ MetaShuffling: 加速L