《超大规模AI实战手册》PDF领取 2025年3月13日14时 作者 GiantPandaCV 《超大规模AI实战手册》是一本实用指南,涵盖从基础理论到实际应用的各个方面。本书由中文翻译,旨在为初学者和专业人士提供见解和技巧,英文原版可在线获取。
复旦NLP团队提出MHA2MLA框架,将任意大模型迁移至DeepSeek MLA 2025年3月7日16时 作者 PaperWeekly 1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一
我们应如何看待DeepSeek的557.6万美元训练成本?| 2025年2月7日23时 作者 甲子光年 教授张钹曾经聊过一个话题:“为什么在提高算法效率上中国人会做得更好?” 张钹告诉我们:“ 对中国企业
扩散模型部署有新解,直接量化为4bit?韩松团队等提出SVDQuant:16GB笔记本上加速8.7 倍 2024年12月5日23时 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨科技猛兽 编辑丨极市平台 极市导读 在 12B FLUX.1-d