MemOS:一种用于 AI 应用的记忆操作系统

大型语言模型(LLM)已成为通用人工智能(AGI)的重要基础设施,然而其缺乏明确定义的记忆管理系统,阻碍了长上下文推理、持续个性化和知识一致性的发展。现有模型主要依赖静态参数和短暂的上下文状态,限制了它们在长期跟踪用户偏好或更新知识的能力。
大型语言模型中记忆系统的演进过程,强调了从定义与探索阶段,到类人记忆发展阶段,再到基于工具的记忆管理阶段的进展。
为应对这一挑战,MemTensor与一众高校联合提出并开源了MemOS
  • 核心理念:MemOS(Memory Operating System)是一个为AI系统设计的记忆操作系统,将记忆视为可管理的系统资源,统一了明文、基于激活的和参数级记忆的表示、调度和演化,实现成本高效的存储和检索。

  • 基本单元——MemCube:MemCube是MemOS中的基本记忆单元,封装了记忆内容和元数据(如来源和版本),支持组合、迁移和融合,使记忆类型之间能够灵活转换,并弥合检索与基于参数的学习之间的差距。

MemOS采用三层架构,包括接口层、操作层和基础设施层。接口层负责与用户或上游系统交互,提供标准化的记忆API;操作层负责组织和调度记忆资源;基础设施层处理记忆数据的存储、安全、迁移和流动。

  • 记忆类型:系统化了三种核心记忆类型——明文记忆、激活记忆和参数记忆,分别对应不同的记忆内容和特性,并支持它们之间的无缝转换和统一调度。

  • 关键模块

    • MemReader:将自然语言输入解析为结构化的记忆操作链。

    • MemScheduler:根据任务意图和上下文动态选择记忆类型,并规划调用顺序和集成策略。

    • MemLifecycle:跟踪记忆单元的生命周期状态,确保记忆资源的可控性和新鲜度。

    • MemGovernance:负责记忆访问控制、合规性执行和审计性,确保记忆在多用户协作和长时任务推理中的安全性、可解释性和可控性。

  • 整体评估:在LOCOMO基准测试中,MemOS在所有推理任务上均达到最佳性能,明显优于其他基线方法(如mem0、LangMem、Zep和OpenAI-Memory),尤其在多跳和时间推理等具有挑战性的场景中表现突出。

  • 记忆检索评估:MemOS在不同记忆配置下的延迟和生成质量方面均表现优异,其检索时间接近较小的基线方法,但LLM评分却超过了全上下文基线,显示出其在混合语义组织和基于激活的记忆加载方面的优势。

  • KV记忆加速评估:通过将频繁访问的明文记忆转换为KV格式的激活记忆,MemOS在多个模型和配置下显著降低了首次响应延迟,且输出序列与直接提示注入方法完全一致,验证了其语义等价性。

MemOS: A Memory OS for AI Systemhttps://arxiv.org/pdf/2507.03724https://github.com/MemTensor/MemOS

(文:PaperAgent)

发表评论