Llama 4 发布:我看到了 DeepSeek 的影子 下午2时 2025/04/06 作者 赛博禅心 Llama 4 发布三款模型:Scout、Maverick 和 Behemoth。参数量分别为109B、400B和2T;Maverick 在多项任务上超越GPT-4,并且推理成本仅为其十分之一。
从啥也不会到DeepSpeed——一篇大模型分布式训练的学习过程总结 下午2时 2024/12/15 下午11时 2024/11/22 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨elihe@知乎(已授权) 来源丨https://zhuanla