DeepSeek-R1 技术剖析:没有强化学习基础也能看懂的 PPO & GRPO 下午11时 2025/03/25 作者 极市干货 .zhihu.com/p/22128744640 编辑丨极市平台 极市导读 本文以通俗易懂的方式剖析
CVPR2025|恺明+LeCun联手带来没有归一化层的Transformer! 下午11时 2025/03/16 作者 极市干货 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本文目录 1 DyT:取代 Transform
NeurIPS 2024 从分类到生成:斯坦福、北大等提出无训练的可控扩散生成 下午8时 2024/12/05 作者 PaperWeekly ©作者 | 叶皓天 单位 | 斯坦福大学博士生 来源 | 机器之心 近年来,扩散模型(Diffusi