日期: 2025 年 2 月 24 日
顶刊TPAMI 2025!北大、KAUST等提出可逆扩散模型赋能图像重建,代码已开源
本文提出了一种可逆扩散模型IDM,通过端到端训练框架和双层可逆网络设计显著提升图像重建性能与效率。在图像压缩感知重建任务中,相比其他方法,该模型在PSNR指标上提升了2dB,并将采样步数从100步减少至3步,推理速度提高了约15倍。
大模型轻量化系列解读 (八):降低 LLM 中因 Activation Spikes 导致的量化误差
型语言模型在后训练量化时面临的激活量化挑战,发现GLU激活中的“激活尖峰”会导致显著的量化误差。为此
模型安全武装,复旦新研究实现SOTA扩散模型风险概念擦除效果,入选AAAI 2025
复旦大学团队提出DuMo网络,通过精准擦除扩散模型中的特定风险概念(如裸露内容、卡通风格等),同时保持其他安全特性不被破坏。研究成果已在顶会AAAI 2025上发表。
DeepSeek开源周首发,H800算力狂飙,网友:提升GPU效率可以,别毁了我的Nvidia股票!
DeepSeek开源周启动,FlashMLA项目因高效MLA解码内核受到关注。此项目优化了可变长度序列处理,并显著降低了GPU内存使用和计算成本。