一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA 下午4时 2025/02/22 作者 机器之心 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
MoE之年的总结和MoE 推理优化的一些认识 下午7时 2025/02/04 作者 GiantPandaCV 0x0. 前言 祝大家新年快乐! 希望大家天天开心,学业有成,工作顺利。 我是在2025农历新年的大
Fused AllGather_MatMul Triton工程实现 下午10时 2025/01/24 作者 GiantPandaCV 0x0. 前言 yifuwang 在 https://github.com/yifuwang/sym
Triton Kernel 编译阶段 下午2时 2025/01/01 作者 GiantPandaCV 博客来源:https://pytorch.org/blog/triton-kernel-compil