

-
核心理念:MemOS(Memory Operating System)是一个为AI系统设计的记忆操作系统,将记忆视为可管理的系统资源,统一了明文、基于激活的和参数级记忆的表示、调度和演化,实现成本高效的存储和检索。
-
基本单元——MemCube:MemCube是MemOS中的基本记忆单元,封装了记忆内容和元数据(如来源和版本),支持组合、迁移和融合,使记忆类型之间能够灵活转换,并弥合检索与基于参数的学习之间的差距。

MemOS采用三层架构,包括接口层、操作层和基础设施层。接口层负责与用户或上游系统交互,提供标准化的记忆API;操作层负责组织和调度记忆资源;基础设施层处理记忆数据的存储、安全、迁移和流动。

-
记忆类型:系统化了三种核心记忆类型——明文记忆、激活记忆和参数记忆,分别对应不同的记忆内容和特性,并支持它们之间的无缝转换和统一调度。
-
关键模块:
-
MemReader:将自然语言输入解析为结构化的记忆操作链。
-
MemScheduler:根据任务意图和上下文动态选择记忆类型,并规划调用顺序和集成策略。
-
MemLifecycle:跟踪记忆单元的生命周期状态,确保记忆资源的可控性和新鲜度。
-
MemGovernance:负责记忆访问控制、合规性执行和审计性,确保记忆在多用户协作和长时任务推理中的安全性、可解释性和可控性。

-
整体评估:在LOCOMO基准测试中,MemOS在所有推理任务上均达到最佳性能,明显优于其他基线方法(如mem0、LangMem、Zep和OpenAI-Memory),尤其在多跳和时间推理等具有挑战性的场景中表现突出。
-
记忆检索评估:MemOS在不同记忆配置下的延迟和生成质量方面均表现优异,其检索时间接近较小的基线方法,但LLM评分却超过了全上下文基线,显示出其在混合语义组织和基于激活的记忆加载方面的优势。
-
KV记忆加速评估:通过将频繁访问的明文记忆转换为KV格式的激活记忆,MemOS在多个模型和配置下显著降低了首次响应延迟,且输出序列与直接提示注入方法完全一致,验证了其语义等价性。



MemOS: A Memory OS for AI System
https://arxiv.org/pdf/2507.03724
https://github.com/MemTensor/MemOS
(文:PaperAgent)