Abstract
MemOS 是由 MemTensor 與多所中國頂尖大學提出的 AI 記憶體作業系統,將記憶體從隱性靜態的模型參數提升為可調度、可管理、可演化的系統級資源。核心創新是以 MemCube 作為基本封裝單元,統一管理 Plaintext、Activation 與 Parameter 三種異質記憶體,並在 LoCoMo 基準達到 LLM Judge 分數 75.80,超越 Mem0(64.57)、Zep(59.22)等基線。
MemOS — AI 記憶體作業系統
Overview
MemOS(Memory Operating System)是由 MemTensor(上海)與多所中國頂尖大學(上海交通大學、浙江大學、北京大學、人民大學等)聯合提出的AI 記憶體作業系統,發表於 arXiv(編號 2507.03724)。其核心理念是將記憶體從隱性、靜態的模型參數或暫時性檢索結果,提升為可調度、可管理、可演化的系統級資源,為 LLM 提供類似傳統作業系統對 CPU/記憶體/儲存的統一調度能力。
現有 LLM 主要依賴靜態參數記憶(parametric memory)與受限的上下文視窗,面對長程推理、持續個人化與知識一致性等需求時有根本性限制。RAG 雖能動態存取外部知識,卻仍是無狀態的「隨選檢索」而非真正的記憶管理系統——缺乏生命週期追蹤、版本控制與權限感知調度機制。MemOS 的誕生正是為了填補這個系統級缺口。^[raw/papers/memos.md]
Core Contributions
MemOS 的核心貢獻可歸納為以下三個軸線:
1. Controllability(可控性) 提供記憶體單元的全生命週期管理,支援創建、啟動、融合、處置的統一調度。實現多層級權限控制與上下文感知啟動策略,透過存取控制與操作審計確保多任務、多用戶環境下的安全性與可追溯性。
2. Plasticity(可塑性) 支援跨任務與角色的記憶體重構與遷移。提供記憶體切片、標籤、層級映射與上下文綁定能力,讓開發者或系統能根據推理目標構建高度適配的記憶體結構,實現快速的認知適應與行為塑造。
3. Evolvability(可演化性) 支援三種記憶體類型(純文字、Activation、參數記憶體)之間的動態轉換與統一調度。系統支援跨記憶體適配——例如將多輪對話中的使用者定義規則轉換為活躍記憶體,或將長期結構化知識蒸餾為參數形式——為知識整合、自主學習與模型演化奠定基礎。^[raw/papers/memos.md]
Architecture / Approach
三層記憶體架構
MemOS 採用模組化三層架構:
| 層級 | 組件 | 功能 |
|---|---|---|
| 介面層(Interface Layer) | MemReader、Memory API、Memory Pipeline | 解析自然語言輸入為結構化記憶操作,提供統一 API 與管線編排 |
| 操作層(Operation Layer) | MemOperator、MemScheduler、MemLifecycle | 負責記憶體組織、檢索、排程與生命週期狀態機管理 |
| 基礎設施層(Infrastructure Layer) | MemGovernance、MemVault、MemLoader/Dumper、MemStore | 執行存取控制、儲存路由、跨平台遷移與開放發布/訂閱機制 |
三種記憶體類型
MemOS 統一管理三種異質記憶體:
- Plaintext Memory:外顯、可編輯的結構化知識片段(檢索段落、知識圖譜、提示模板),透過外部介面存取,快速更新、個人化。
- Activation Memory:推理過程中生成的中間狀態,以 KV-cache 為核心結構,支援長程依賴建模與快取穩定行為。
- Parameter Memory:編碼於模型權重中的知識(FFNN 權重矩陣、注意力 K/V 矩陣),透過 LoRA/adapter 等輕量微調增強,為模型提供長期語義能力基底。^[raw/papers/memos.md]
MemCube — 核心封裝單元
MemCube 是 MemOS 的基本記憶體封裝單元,每個實例包含:
- Memory Payload:儲存語義內容(純文字、Activation 張量或參數 delta)
- Metadata Header:包含描述標識符(時間戳、來源簽名、語義類型)、治理屬性(存取控制、TTL、優先級、合規追蹤)與行為使用指標(訪問頻率、冷熱狀態)
透過 MemCube,MemOS 實現了統一的記憶體調度、跨模態轉換(如 Plaintext ⇒ Activation ⇒ Parameter 的動態遷移)與基於使用價值的自適應排程。^[raw/papers/memos.md]
與傳統 OS 的類比
MemOS 從傳統作業系統汲取設計靈感,建立明確的元件對應關係:
| OS 組件 | MemOS 模組 | 角色 |
|---|---|---|
| Register / Microcode | Parameter Memory | 長期能力 |
| Cache | Activation Memory | 快速工作狀態 |
| I/O Buffer | Plaintext Memory | 外部事件 |
| Scheduler | MemScheduler | 優先順序調度 |
| File System | MemVault | 版本化儲存 |
| System Call | Memory API | 統一存取介面 |
| Device Driver | MemLoader/Dumper | 記憶體遷移 |
| Package Manager | MemStore | 共享套件 |
| Auth / ACLs | MemGovernance | 存取控制 |
Key Results
MemOS(MemOS-1031)在多項基準測試中達到 SOTA 表現:
LoCoMo 基準(長程對話記憶):在單跳、多跳、時序推理、開放域等所有子任務中排名第一或第二,整體 LLM Judge 分數 75.80,超越 Mem0(64.57)、Zep(59.22)等基線。
LongMemEval 基準:幾乎所有任務類別達到最佳平均表現,整體精確度 77.8%,領先 Memobase(72.4%)與 Supermemory(58.4%)。
PreFEval 個人化基準(0 turn:77.2%、10 turn:71.9%),偏好盲區錯誤率最低(4.6%),展現穩定的使用者意圖識別能力。
PersonaMem 基準:Precision(1 in 4)達 61.2%,為所有基線最高。
KV 加速效果:Qwen2.5-72B 在長上下文(6064 tokens)下,KV-based 注入相比純 Prompt 注入將 TTFT 降低 91.4%,且輸出語意完全等價。^[raw/papers/memos.md]
MemOS 的應用場景
多輪對話與跨任務連續性:將每輪使用者輸入中的關鍵要素(預算、偏好、限制)編碼為結構化對話記憶單元,跨任務記憶復用實現狀態持久化。
知識演化與持續更新:每個記憶單元有獨立生命週期(生成→啟動→融合→歸檔),支援版本比對與廢棄追蹤,無需昂貴的模型重訓練即可保持知識時效性。
個人化與多角色建模:每個用戶身份關聯專屬記憶空間,長程互動模式編碼為「個人記憶單元」,產生一致且個人化的 AI 行為。
跨平台記憶遷移:標準化記憶體表示、加密與平台無關的掛載協定,打破「記憶孤島」,使記憶可在移動端、雲端與企業基礎設施間便攜流動。^[raw/papers/memos.md]
Limitations
論文中提及的未來方向包括:
- 跨 LLM 記憶共享:需擴展 Memory Interchange Protocol(MIP)以支援不同基礎模型間的語義一致性與安全交換。
- 自演化 MemBlock:發展能基於使用回饋自動優化、重構的記憶單元,減少人工維護成本。
- 可擴展記憶體市場:建立去中心化記憶體交易所,支援資產級交易、協作更新與分布式演化。
此外,MemOS 目前仍處於研究階段,其在超大規模部署、多租戶安全隔離與長期記憶一致性等工程挑戰尚待更多實踐驗證。^[raw/papers/memos.md]
Related Entities
- skill-claw — 技能蒸餾與跨 Agent 遷移的相關研究,與 MemOS 的記憶可演化性(Evolvability)有互補關係。
- agentscope — 大規模多智能體模擬平台,專注於 100K+ 等級 Agent 的超大規模並行模擬;MemOS 的記憶管理能力可作為此類大規模多 Agent 系統的底層基礎設施。
- openhands — AI Agent 編碼平台,skill-claw 技能的繼承者,可與 MemOS 的記憶調度框架整合以增強長期任務記憶能力。
- tool-attention-mcp-tax — Tool-use 與 MCP 相關研究,與 MemOS 的 Memory API 層提供標準化工具呼叫介面的設計思路相關。
- memory(agent-memory)— MemOS 本身就是一套完整的 agent 記憶系統,是記憶管理領域從 RAG 到 OS-level 治理的典範轉移。
- multi-agent-systems — 多智能體系統的概念背景,MemOS 的 MemStore 發布-訂閱機制與跨 Agent 記憶共享能力直接服務於此領域。