打破自回归模型的“速度枷锁”!NYU、宾大等发布「推测解码技术」最新综述 下午4时 2025/03/21 作者 PaperWeekly 制约其发展的关键瓶颈。 在这一背景下,如何在保持高质量输出的同时,显著提升模型的推理速度,以满足实时
WWW 2025 TAMU、UIUC等提出全新因素链框架,用于论文-评审人匹配 下午11时 2025/03/05 作者 PaperWeekly 提交数量的迅速增加,我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评
ICLR 2025 8B模型反超Llama3-70B!TeleAI提出探索驱动的对齐方法COPO 下午4时 2025/02/05 作者 PaperWeekly 在自然界中,好奇心驱使着生物探索未知,是生存和进化的关键。人类,作为地球上最具智能的物种,其探索精神
Day 2 「强化微调」文字稿:强烈推荐各个专业领域尤其搞科研的看看 下午1时 2024/12/07 作者 AI寒武纪 今天的发布会OpenAI推出了强化微调研究计划(Reinforcement Fine-Tuning