让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?

新智元报道
编辑:定慧
OpenAI发布的新基准测试数据集MRCR,旨在检验模型在超长上下文中精准定位特定信息的能力。这比「大海捞针」的简单任务更具挑战性。通过MRCR测试,GPT-4.1展示了其强大的上下文理解和处理能力,但随着上下文长度和复杂度增加,准确性会迅速下降。

迈向长上下文视频生成!FAR重塑下一帧预测范式,短视频与长视频双双登顶SOTA

本文首次系统性地研究并提出了高效建模长上下文视频生成的方法,通过重构视频生成任务为逐帧预测,并引入长短时上下文的非对称patchify策略和多层KV Cache机制,实现了高效的长视频训练与长上下文视频生成。