MemOS：一种用于 AI 应用的记忆操作系统

大型语言模型（LLM）已成为通用人工智能（AGI）的重要基础设施，然而其缺乏明确定义的记忆管理系统，阻碍了长上下文推理、持续个性化和知识一致性的发展。现有模型主要依赖静态参数和短暂的上下文状态，限制了它们在长期跟踪用户偏好或更新知识的能力。

大型语言模型中记忆系统的演进过程，强调了从定义与探索阶段，到类人记忆发展阶段，再到基于工具的记忆管理阶段的进展。

为应对这一挑战，MemTensor与一众高校联合提出并开源了MemOS：

核心理念：MemOS（Memory Operating System）是一个为AI系统设计的记忆操作系统，将记忆视为可管理的系统资源，统一了明文、基于激活的和参数级记忆的表示、调度和演化，实现成本高效的存储和检索。
基本单元——MemCube：MemCube是MemOS中的基本记忆单元，封装了记忆内容和元数据（如来源和版本），支持组合、迁移和融合，使记忆类型之间能够灵活转换，并弥合检索与基于参数的学习之间的差距。

MemOS采用三层架构，包括接口层、操作层和基础设施层。接口层负责与用户或上游系统交互，提供标准化的记忆API；操作层负责组织和调度记忆资源；基础设施层处理记忆数据的存储、安全、迁移和流动。

整体评估：在LOCOMO基准测试中，MemOS在所有推理任务上均达到最佳性能，明显优于其他基线方法（如mem0、LangMem、Zep和OpenAI-Memory），尤其在多跳和时间推理等具有挑战性的场景中表现突出。
记忆检索评估：MemOS在不同记忆配置下的延迟和生成质量方面均表现优异，其检索时间接近较小的基线方法，但LLM评分却超过了全上下文基线，显示出其在混合语义组织和基于激活的记忆加载方面的优势。
KV记忆加速评估：通过将频繁访问的明文记忆转换为KV格式的激活记忆，MemOS在多个模型和配置下显著降低了首次响应延迟，且输出序列与直接提示注入方法完全一致，验证了其语义等价性。

MemOS: A Memory OS for AI Systemhttps://arxiv.org/pdf/2507.03724https://github.com/MemTensor/MemOS

（文：PaperAgent）