反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗? 下午4时 2025/04/07 作者 机器之心 抛弃反向传播并重新开始。」早在几年前,使反向传播成为深度学习核心技术之一的 Geoffrey Hin
regrad是一个不同于 micrograd 的小巧反向自动微分实现 上午8时 2025/03/03 作者 NLP工程化 regrad是一个用于自动微分的新实现,支持绘制计算图并标记不同类型节点(深蓝、浅蓝、灰),便于理解反向传播机制。
扩散模型(Diffusion Model)详解:直观理解、数学原理、PyTorch 实现 下午11时 2025/02/28 作者 极市干货 读 本文详细介绍了扩散模型的原理、数学基础以及基于PyTorch的实现方法。文章从图像生成任务的背景
教学项目:scratch-pytorch-step-by-step 上午8时 2025/02/20 作者 NLP工程化 通过Python实现类似PyTorch的深度学习框架项目介绍,涵盖反向传播、随机梯度下降等算法及CNN、RNN等多种模型。
图解Megatron TP中的计算通信overlap 下午11时 2025/01/06 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨猛猿 来源丨大猿搬砖简记 编辑丨极市平台 极市导读 本文探讨了M