Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o 下午4时 2025/05/27 作者 新智元 Meta发布KernelLLM,一个基于Llama 3.1微调的8B模型,能够在PyTorch代码基础上生成高效的Triton GPU内核,单次推理性能超越GPT-4o和DeepSeek V3。