大型语言模型归档 - 每时AI

ICML2025大语言模型竟然有“前瞻思维”？首个词元生成前便能预判全局输出

2025年6月27日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

显著提升小LLM的性能，将所有kernel搞到一个巨大kernel中，即MegaKernel

2025年6月23日23时作者极市干货

介绍了 Mirage Persistent Kernel，它能自动把小语言模型（LLM）推理转化为一

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

2025年6月21日16时作者机器之心

理的核心计算引擎。
不过，CUDA 驱动的 LLM 推理面临着手动优化成本高、端到端延迟高等不足，需

必看！Andrej Karpathy 昨天在 YC 的旧金山创业大会 40 分钟的演讲，全是干货，文末附资料！

2025年6月20日11时作者 GitHubStore

Andrej Karpathy 在 YC 的旧金山创业大会上分享了关于 AI 时代软件开发的新范式。他定义了从传统代码到神经网络权重再到大型语言模型（LLMs）的发展路径，讨论了 LLMs 的超能力和认知缺陷，并介绍了如何通过应用如 Cursor 实现部分自主应用来优化用户体验。

谢赛宁团队新基准让LLM集体自闭，DeepSeek R1、Gemini 2.5 Pro都是零分

2025年6月19日8时作者机器之心

s（如 GPT-4、Claude、Gemini 等）在代码生成领域取得了显著进展。它们不仅在经典编程