长上下文理解归档

告别O(n²)！上海AI Lab开源Linear-MoE：线性注意力+MoE的终极缝合术

下午4时 2025/06/06 作者 PaperWeekly

近期研究表明，线性序列建模（如 Lightning Attention、Mamba2）与混合专家模型架构（MoE）的结合在高效大模型领域引起了广泛关注。上海人工智能实验室团队的最新研究首次系统地实现了这两种技术的结合，并开源了完整的技术框架。

下午11时 2025/03/17 作者机器之心

桐郑子隆王希元张牧涵
长文本任务是当下大模型研究的重点之一。在实际场景和应用中，普遍存在大量长

下午4时 2025/01/22 作者机器之心

谷歌发布Gemini 2.0 Flash Thinking新版本，引入1M长上下文窗口，在Chatbot Arena中再次夺冠。其亮点包括强大的多模态理解和流畅的对话过程，展示了模型在多个领域的强大能力。

下午4时 2025/01/15 作者量子位

开源模型上下文窗口扩展至400万token。MiniMax-Text-01及MiniMax-VL-01分别展示了强大的长文本处理能力和多模态识别能力，参数量大、上下文支持能力强。