OpenClaw

概述

OpenClaw 是一個開源的多用戶 LLM Agent 框架,旨在透過自然對話實現複雜任務的自動化^[raw/papers/skill-claw.md]。該框架是 SkillClaw 的基礎設施——一個集體技能演化層,允許多個用戶共享已學習的技能並形成持續演化的技能網絡^[raw/papers/skill-claw.md]。

在 OpenClaw 風格的 Agent 生態系統中,用戶與部署的 Agent 互動以完成任務,例如配置服務、調試 API 呼叫或自動化多步驟工作流程。這些能力主要由 技能(skills) 驅動——可重複使用的程序性構建模塊,編碼了與工具互動和解決任務的結構化程序^[raw/papers/skill-claw.md]。該框架設計用於支援多種 Claw 風格的 Agent 變體,包括 CoPaw、IronClaw、PicoClaw、ZeroClaw、NanoClaw 和 NemoClaw^[raw/papers/skill-claw.md]。

技能在 Agent 生態系統中日益重要的證據是技能經濟的興起:根據 skills.sh 數據構建的公共儀表板報告顯示,截至 2026 年 3 月 31 日,有 90,368 個已發布的技能、9,485 位發布者以及 2,430 萬次累計安裝^[raw/papers/skill-stealing-attack.md]。付費市場也已出現,Claw Mart 等平台報告有 2,000+ 個上架商品,創作者收入超過 100,000 美元,明確將付費技能和人格作為可下載的數位商品進行銷售^[raw/papers/skill-stealing-attack.md]。

核心貢獻

OpenClaw 提供了幾個關鍵能力,使其作為多用戶 Agent 框架與眾不同:

多用戶支援:單一 Agent 實例可同時為多個用戶服務,每個用戶的互動都會產生會話軌跡,保留完整的操作-回饋因果鏈^[raw/papers/skill-claw.md]。這使框架能夠跨用戶和時間聚合經驗。

基於技能的架構:該框架將技能視為 Agent 行為的主要構建模塊。用戶通常從集中式技能中心選擇和安裝技能以滿足需求,這些技能作為可重複使用的能力包^[raw/papers/skill-claw.md]。技能通常包含:

  • 元資料:用於技能發現的名稱和描述
  • 指令:指定步驟、輸出和完成標準的結構化工作流程
  • 資源:支援性的模板、範例、綱要或可執行腳本^[raw/papers/skill-stealing-attack.md]

技能封裝:工作流程被打包成可分享的技能單元,可跨用戶社區分發、安裝和重複使用^[raw/papers/skill-claw.md]。

動態演化:技能可以根據用戶回饋持續改進,形成閉環系統,其中互動數據推動技能更新,而更新的技能又改善後續互動^[raw/papers/skill-claw.md]。

架構

OpenClaw 採用集中式演化架構,透過共用技能倉庫連接獨立部署的 Agent^[raw/papers/skill-claw.md]。整體系統架構由幾個互連的元件組成:

┌─────────────────────────────────────────────────────────────┐
│                    OpenClaw Framework                       │
├─────────────────────────────────────────────────────────────┤
│  Multi-User Agents                                          │
│  ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐          │
│  │  User   │ │  User   │ │  User   │ │  User   │  ...    │
│  │   Claw1 │ │   Claw2 │ │   Claw3 │ │   Claw4 │          │
│  └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘          │
│       │           │           │           │                 │
│       └───────────┴─────┬─────┴───────────┘               │
│                         ▼                                   │
│              ┌─────────────────────┐                       │
│              │   Skill Repository  │                       │
│              │   (Shared Pool)     │                       │
│              └──────────┬──────────┘                       │
│                         │                                   │
│       ┌─────────────────┴─────────────────┐                │
│       ▼                                   ▼                │
│  ┌─────────────────────┐     ┌─────────────────────┐      │
│  │  Session Trajectory │     │  Agentic Evolver    │      │
│  │     Collection      │────▶│  (Night-time)       │      │
│  └─────────────────────┘     └──────────┬──────────┘      │
│                                         │                  │
│                                         ▼                  │
│                              ┌─────────────────────┐       │
│                              │  Validation Stage   │       │
│                              │  (Night-time)      │       │
│                              └──────────┬──────────┘       │
│                                         │                  │
│                                         ▼                  │
│                              ┌─────────────────────┐       │
│                              │  Skill Update &     │       │
│                              │  Synchronization    │       │
│                              └─────────────────────┘       │
└─────────────────────────────────────────────────────────────┘

軌跡記錄

每次用戶互動都會產生一個會話軌跡,記錄完整的互動環節:提示、Agent 的操作(包括工具呼叫)、來自環境或用戶的回饋,以及最終的 Agent 回應^[raw/papers/skill-claw.md]。這種結構化記錄保留了因果鏈:

prompt → action → feedback → ··· → agent response

每個會話也會提取輕量級元資料:使用了哪些技能、是否發生了工具錯誤,以及粗略的品質估計^[raw/papers/skill-claw.md]。

技能同步

經過演化和驗證後,更新後的技能會同步回所有 Agent,形成持續的演化循環^[raw/papers/skill-claw.md]:

Multi-user Interaction → Session Collection → Skill Evolution → Validation → Skill Synchronization

日夜循環

系統以日夜循環方式運作:

  • 白天:用戶與部署的 OpenClaw Agent 互動以完成任務,產生會話軌跡
  • 夜間:系統處理收集的互動數據,生成候選技能更新,在可用的空閒用戶環境中進行驗證,並同步已批准的技能^[raw/papers/skill-claw.md]

相容性

OpenClaw 設計為一個通用框架,相容於多種 Claw 風格的 Agent 系統,包括 CoPaw、IronClaw、PicoClaw、ZeroClaw、NanoClaw 和 NemoClaw 等基礎變體^[raw/papers/skill-claw.md]。框架的技能倉庫架構 also enables integration with GUI agent frameworks that share similar tool-calling design patterns, such as clawgui, which provides a GUI Agent framework with analogous tool invocation mechanisms ^[raw/papers/skill-claw.md].

關鍵結果

SkillClaw 基於 OpenClaw 構建,在 WildClawBench 上進行了評估——這是一個真實世界的 Agent 基準測試,由跨六個能力領域的 60 個複雜任務組成,涵蓋生產力工作流程、程式碼執行、社交互動、檢索、創意生成和安全對齊^[raw/papers/skill-claw.md]。

WildClawBench 特徵

屬性描述
執行環境帶工具的完整 Linux 容器
多模態文字、程式碼、圖像、影片
評估方式3–27 個指標聚合
嚴格約束關鍵錯誤 → 零分
任務長度15–50 步
外部依賴API 和模型下載

WildClawBench 效能改進

實驗模擬了為期 6 天的 8 個並發用戶的真實部署場景(6 輪)。每天由白天線上互動和夜間技能演化與驗證組成,由 Qwen3-Max 提供支援^[raw/papers/skill-claw.md]。

結果顯示四個評估類別都呈現一致的演化模式:

類別第 1 天(基線)第 2 天第 3 天第 4 天第 5 天第 6 天絕對增益相對增益
社交互動54.01%60.34%60.34%60.34%60.34%60.34%+6.33+11.72%
搜尋與檢索22.73%30.00%30.00%34.55%34.55%34.55%+11.82+52.00%
創意合成11.57%21.80%21.80%21.80%21.80%21.80%+10.23+88.41%
安全與對齊24.00%24.00%24.00%24.00%32.00%32.00%+8.00+33.33%

結果分析

社交互動 最早且最顯著地改善,從第 2 天的 54.01% 上升到 60.34%,此後保持穩定。這表明存在一個具有廣泛覆蓋範圍的高影響工作流程瓶頸^[raw/papers/skill-claw.md]。

搜尋與檢索 遵循更分階段的改善軌跡,從 22.73% 上升到 30.00%,然後進一步上升到 34.55%。收益來自一系列改進:首先解決輸入驗證和文件可訪問性問題,然後構建約束感知的檢索規劃^[raw/papers/skill-claw.md]。

創意合成 在第 2 天出現大幅早期跳躍,從 11.57% 上升到 21.80%,表明主要瓶頸在於環境設置(文件處理、工作目錄配置、多模態管道)而非內容生成本身^[raw/papers/skill-claw.md]。

安全與對齊 較晚改善,從 24.00% 上升到 32.00%。改進針對真實環境中的執行可靠性,包括 Git 回退、目錄克隆協議和在非互動式環境中的安全執行^[raw/papers/skill-claw.md]。

限制

儘管 OpenClaw 及其基於它構建的 SkillClaw 框架有效,但仍有一些限制:

小規模評估:該研究代表了集體技能演化的小規模測試,擁有有限的用戶查詢、回饋信號和互動深度。只有 8 個並發用戶參與,實驗僅持續 6 天^[raw/papers/skill-claw.md]。

驗證開銷:驗證機制會引入額外的 token 成本,因為候選技能必須在具有完整工具互動的真實環境中執行。與不經過驗證的直接部署相比,這種開銷可能相當可觀,儘管它能帶來更穩定的用戶面效能^[raw/papers/skill-claw.md]。

僅單調改進:驗證策略確保只有改進被接受,導致單調的部署行為。雖然這防止了效能下降,但也可能減緩對潛在風險但高回報技能更新的探索^[raw/papers/skill-claw.md]。

技能竊取漏洞:OpenClaw 的基於技能的架構引入了一個新的攻擊面。研究表明,專有技能可以透過黑盒技能竊取攻擊(僅需 3 次互動)提取,這對版權和經濟安全構成嚴重風險^[raw/papers/skill-stealing-attack.md]。技能經濟——擁有 90,368 個已發布技能和產生 100,000+ 美元的付費市場——為未經授權的提取創造了直接動機^[raw/papers/skill-stealing-attack.md]。即使是最基本的直接提取提示(NO,NO)也能達到 48% EM、79.95% ROUGE-L 和 95.11% 餘弦相似度,平均 LLM-洩漏比率為 0.91^[raw/papers/skill-stealing-attack.md]。

黑盒約束:該框架假設一個現實的黑盒對手,該對手僅透過其公共用戶介面或 API 與目標 Agent 互動,無法直接訪問後端系統、模型權重或內部技能文件^[raw/papers/skill-stealing-attack.md]。然而,這種威脅模型仍然允許透過精心設計的提示進行大量技能提取。

相關頁面

  • skill-claw — 基於 OpenClaw 構建的集體技能演化框架,實現跨用戶知識轉移和累積能力提升
  • skill-stealing-attack — 針對 OpenClaw 等 Agent 系統的黑盒技能竊取攻擊安全研究
  • clawgui — 與 OpenClaw 具有相似工具呼叫設計模式的 GUI Agent 框架