GSM8K 归档 - 每时AI

清华第三代Sage注意力发布！提速5倍，精度不降，训推都能用

2025年7月7日23时作者新智元

FP4量化实现推理加速，比FlashAttention快5倍，同时探索了8比特注意力用于训练任务的可

2025年3月18日23时作者极市干货

认识这个过程，而不是严谨地对每一个剖析细节，因此基本没有公式推导，但一些必要的符号是避免不了的；
第

MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。近日，一篇关于LLM的论文提出TokenSkip方法，通过跳过不重要token来压缩思维链，提高推理速度和用户体验。

2025年3月3日16时作者量子位

来自华为、港大、KAUST和马普所的研究者提出了一种新的稀疏注意力机制——SepLLM，它通过根据原生语义动态划分token数量来显著减少KV缓存使用量，并在免训练、预训练和后训练场景下实现了50%以上的KV缓存减少。

2025年2月15日8时作者 NLP工程化

GSM8K-RLVR利用强化学习提升语言模型数学解题能力，Qwen2.5-Math-1.5B模型准确率从70.66%提升至77.33%，简化提示格式无需复杂标签。

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

2025年1月17日16时作者 PaperWeekly

OmAgent v0.2.2 新版本发布，引入了Agent Operator简化复杂智能体功能的调用，并推出了Open Agent Leaderboard开源评测平台，支持多种主流算法和模型，统一评估框架确保公平性。

2024年12月11日13时2024年11月23日13时作者机器之心

机器之心报道
编辑：Panda、张倩
开源模型阵营又迎来一员猛将：Tülu 3。它来自艾伦人工智能研