长上下文归档

让GPT-4.1「头皮发麻的考试」！OpenAI给大模型上强度，AI能赢吗？

2025年5月4日23时作者新智元

新智元报道
编辑：定慧
OpenAI发布的新基准测试数据集MRCR，旨在检验模型在超长上下文中精准定位特定信息的能力。这比「大海捞针」的简单任务更具挑战性。通过MRCR测试，GPT-4.1展示了其强大的上下文理解和处理能力，但随着上下文长度和复杂度增加，准确性会迅速下降。

2025年4月28日8时作者 PaperWeekly

本文首次系统性地研究并提出了高效建模长上下文视频生成的方法，通过重构视频生成任务为逐帧预测，并引入长短时上下文的非对称patchify策略和多层KV Cache机制，实现了高效的长视频训练与长上下文视频生成。

2025年4月15日11时作者量子位

OpenAI发布了GPT-4.1系列模型，相比前代GPT-4.5有显著提升。新版本包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano，主打长上下文处理能力和性价比。

2025年4月15日8时作者机器之心

含了三个模型，分别是
GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano，它们仅

2025年3月24日16时作者机器之心

架构的挑战。
在众多非 Transformer 架构中，Mamba 无疑是声量较大且后续发展较好的一

2025年1月21日16时作者 Founder Park

文章转载自「新智元」，略有调整。
1 月 20 日，Kimi发布了k1.5 多模态思考模型。这是继去