《超大规模AI实战手册》PDF领取 下午2时 2025/03/13 作者 GiantPandaCV 《超大规模AI实战手册》是一本实用指南,涵盖从基础理论到实际应用的各个方面。本书由中文翻译,旨在为初学者和专业人士提供见解和技巧,英文原版可在线获取。
复旦NLP团队提出MHA2MLA框架,将任意大模型迁移至DeepSeek MLA 下午4时 2025/03/07 作者 PaperWeekly 1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一
我们应如何看待DeepSeek的557.6万美元训练成本?| 下午11时 2025/02/07 作者 甲子光年 教授张钹曾经聊过一个话题:“为什么在提高算法效率上中国人会做得更好?” 张钹告诉我们:“ 对中国企业
扩散模型部署有新解,直接量化为4bit?韩松团队等提出SVDQuant:16GB笔记本上加速8.7 倍 下午11时 2024/12/05 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨科技猛兽 编辑丨极市平台 极市导读 在 12B FLUX.1-d