PaperWeekly
AAAI 2025 免训练低成本!上海交大提出用于高效扩散模型的令牌剪枝方法
上海交通大学提出SiTo方法,通过基于相似性的令牌剪枝技术,无需训练且硬件友好地加速扩散模型。显著提升了生成质量并减少了内存和计算成本。
威立执行副总裁Jay Flynn接受科技日报采访:科学出版数字化转型的见证者
威立执行副总裁杰伊·弗林谈见证中国科研迅猛发展、人工智能在出版领域的应用以及向开放获取转型的重要性。他指出中国作者发表论文数量位列世界首位,并积极推动全球学术交流与合作。
ICLR 2025 自动化所、旷视等提出Ross,多模态大模型的MAE时刻来了?
本文介绍了一篇关于多模态大模型的研究论文《Reconstructive Visual Instruction Tuning》,提出通过重建输入图像作为监督信号来提升视觉部分的学习效果,显著提高模型的细粒度理解能力,并且代码已开源。
无需RLHF显著提升GPT-4性能,北大团队提出对齐新范式「残差修正」 NeurIPS 2024 Oral
学习对齐答案和未对齐答案之间的残差,要比直接学习问题到答案之间的映射更容易。
背景
当下大语言模型(