ICML 2025 何恺明的“残差连接”被魔改,新架构给Transformer建了个“动态立交”,28亿参数打平69亿 2025年6月30日23时 作者 极市干货 对Transformer中的残差连接进行了创新性改造,仅增加极少的参数和计算量,就让28亿参数的模型
诚邀参加 青岛AICC”用昇腾玩转DeepSeek、Qwen开发实战”集训营活动 2025年3月21日23时 作者 极市干货 多模态大模型深入解读专栏介绍,涵盖Transformer系列、LVM模型及扩散模型等内容。