OpenClaw

概述

OpenClaw 是一個開源的多用戶 LLM Agent 框架，旨在透過自然對話實現複雜任務的自動化^[raw/papers/skill-claw.md]。該框架是 SkillClaw 的基礎設施——一個集體技能演化層，允許多個用戶共享已學習的技能並形成持續演化的技能網絡^[raw/papers/skill-claw.md]。

在 OpenClaw 風格的 Agent 生態系統中，用戶與部署的 Agent 互動以完成任務，例如配置服務、調試 API 呼叫或自動化多步驟工作流程。這些能力主要由 技能（skills） 驅動——可重複使用的程序性構建模塊，編碼了與工具互動和解決任務的結構化程序^[raw/papers/skill-claw.md]。該框架設計用於支援多種 Claw 風格的 Agent 變體，包括 CoPaw、IronClaw、PicoClaw、ZeroClaw、NanoClaw 和 NemoClaw^[raw/papers/skill-claw.md]。

技能在 Agent 生態系統中日益重要的證據是技能經濟的興起：根據 skills.sh 數據構建的公共儀表板報告顯示，截至 2026 年 3 月 31 日，有 90,368 個已發布的技能、9,485 位發布者以及 2,430 萬次累計安裝^[raw/papers/skill-stealing-attack.md]。付費市場也已出現，Claw Mart 等平台報告有 2,000+ 個上架商品，創作者收入超過 100,000 美元，明確將付費技能和人格作為可下載的數位商品進行銷售^[raw/papers/skill-stealing-attack.md]。

核心貢獻

OpenClaw 提供了幾個關鍵能力，使其作為多用戶 Agent 框架與眾不同：

多用戶支援：單一 Agent 實例可同時為多個用戶服務，每個用戶的互動都會產生會話軌跡，保留完整的操作-回饋因果鏈^[raw/papers/skill-claw.md]。這使框架能夠跨用戶和時間聚合經驗。

基於技能的架構：該框架將技能視為 Agent 行為的主要構建模塊。用戶通常從集中式技能中心選擇和安裝技能以滿足需求，這些技能作為可重複使用的能力包^[raw/papers/skill-claw.md]。技能通常包含：

元資料：用於技能發現的名稱和描述
指令：指定步驟、輸出和完成標準的結構化工作流程
資源：支援性的模板、範例、綱要或可執行腳本^[raw/papers/skill-stealing-attack.md]

技能封裝：工作流程被打包成可分享的技能單元，可跨用戶社區分發、安裝和重複使用^[raw/papers/skill-claw.md]。

動態演化：技能可以根據用戶回饋持續改進，形成閉環系統，其中互動數據推動技能更新，而更新的技能又改善後續互動^[raw/papers/skill-claw.md]。

架構

OpenClaw 採用集中式演化架構，透過共用技能倉庫連接獨立部署的 Agent^[raw/papers/skill-claw.md]。整體系統架構由幾個互連的元件組成：

┌─────────────────────────────────────────────────────────────┐
│                    OpenClaw Framework                       │
├─────────────────────────────────────────────────────────────┤
│  Multi-User Agents                                          │
│  ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐          │
│  │  User   │ │  User   │ │  User   │ │  User   │  ...    │
│  │   Claw1 │ │   Claw2 │ │   Claw3 │ │   Claw4 │          │
│  └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘          │
│       │           │           │           │                 │
│       └───────────┴─────┬─────┴───────────┘               │
│                         ▼                                   │
│              ┌─────────────────────┐                       │
│              │   Skill Repository  │                       │
│              │   (Shared Pool)     │                       │
│              └──────────┬──────────┘                       │
│                         │                                   │
│       ┌─────────────────┴─────────────────┐                │
│       ▼                                   ▼                │
│  ┌─────────────────────┐     ┌─────────────────────┐      │
│  │  Session Trajectory │     │  Agentic Evolver    │      │
│  │     Collection      │────▶│  (Night-time)       │      │
│  └─────────────────────┘     └──────────┬──────────┘      │
│                                         │                  │
│                                         ▼                  │
│                              ┌─────────────────────┐       │
│                              │  Validation Stage   │       │
│                              │  (Night-time)      │       │
│                              └──────────┬──────────┘       │
│                                         │                  │
│                                         ▼                  │
│                              ┌─────────────────────┐       │
│                              │  Skill Update &     │       │
│                              │  Synchronization    │       │
│                              └─────────────────────┘       │
└─────────────────────────────────────────────────────────────┘

軌跡記錄

每次用戶互動都會產生一個會話軌跡，記錄完整的互動環節：提示、Agent 的操作（包括工具呼叫）、來自環境或用戶的回饋，以及最終的 Agent 回應^[raw/papers/skill-claw.md]。這種結構化記錄保留了因果鏈：

prompt → action → feedback → ··· → agent response

每個會話也會提取輕量級元資料：使用了哪些技能、是否發生了工具錯誤，以及粗略的品質估計^[raw/papers/skill-claw.md]。

技能同步

經過演化和驗證後，更新後的技能會同步回所有 Agent，形成持續的演化循環^[raw/papers/skill-claw.md]：

Multi-user Interaction → Session Collection → Skill Evolution → Validation → Skill Synchronization

日夜循環

系統以日夜循環方式運作：

白天：用戶與部署的 OpenClaw Agent 互動以完成任務，產生會話軌跡
夜間：系統處理收集的互動數據，生成候選技能更新，在可用的空閒用戶環境中進行驗證，並同步已批准的技能^[raw/papers/skill-claw.md]

相容性

OpenClaw 設計為一個通用框架，相容於多種 Claw 風格的 Agent 系統，包括 CoPaw、IronClaw、PicoClaw、ZeroClaw、NanoClaw 和 NemoClaw 等基礎變體^[raw/papers/skill-claw.md]。框架的技能倉庫架構 also enables integration with GUI agent frameworks that share similar tool-calling design patterns, such as clawgui, which provides a GUI Agent framework with analogous tool invocation mechanisms ^[raw/papers/skill-claw.md].

關鍵結果

SkillClaw 基於 OpenClaw 構建，在 WildClawBench 上進行了評估——這是一個真實世界的 Agent 基準測試，由跨六個能力領域的 60 個複雜任務組成，涵蓋生產力工作流程、程式碼執行、社交互動、檢索、創意生成和安全對齊^[raw/papers/skill-claw.md]。

WildClawBench 特徵

屬性	描述
執行環境	帶工具的完整 Linux 容器
多模態	文字、程式碼、圖像、影片
評估方式	3–27 個指標聚合
嚴格約束	關鍵錯誤 → 零分
任務長度	15–50 步
外部依賴	API 和模型下載

WildClawBench 效能改進

實驗模擬了為期 6 天的 8 個並發用戶的真實部署場景（6 輪）。每天由白天線上互動和夜間技能演化與驗證組成，由 Qwen3-Max 提供支援^[raw/papers/skill-claw.md]。

結果顯示四個評估類別都呈現一致的演化模式：

類別	第 1 天（基線）	第 2 天	第 3 天	第 4 天	第 5 天	第 6 天	絕對增益	相對增益
社交互動	54.01%	60.34%	60.34%	60.34%	60.34%	60.34%	+6.33	+11.72%
搜尋與檢索	22.73%	30.00%	30.00%	34.55%	34.55%	34.55%	+11.82	+52.00%
創意合成	11.57%	21.80%	21.80%	21.80%	21.80%	21.80%	+10.23	+88.41%
安全與對齊	24.00%	24.00%	24.00%	24.00%	32.00%	32.00%	+8.00	+33.33%

結果分析

社交互動 最早且最顯著地改善，從第 2 天的 54.01% 上升到 60.34%，此後保持穩定。這表明存在一個具有廣泛覆蓋範圍的高影響工作流程瓶頸^[raw/papers/skill-claw.md]。

搜尋與檢索 遵循更分階段的改善軌跡，從 22.73% 上升到 30.00%，然後進一步上升到 34.55%。收益來自一系列改進：首先解決輸入驗證和文件可訪問性問題，然後構建約束感知的檢索規劃^[raw/papers/skill-claw.md]。

創意合成 在第 2 天出現大幅早期跳躍，從 11.57% 上升到 21.80%，表明主要瓶頸在於環境設置（文件處理、工作目錄配置、多模態管道）而非內容生成本身^[raw/papers/skill-claw.md]。

安全與對齊 較晚改善，從 24.00% 上升到 32.00%。改進針對真實環境中的執行可靠性，包括 Git 回退、目錄克隆協議和在非互動式環境中的安全執行^[raw/papers/skill-claw.md]。

限制

儘管 OpenClaw 及其基於它構建的 SkillClaw 框架有效，但仍有一些限制：

小規模評估：該研究代表了集體技能演化的小規模測試，擁有有限的用戶查詢、回饋信號和互動深度。只有 8 個並發用戶參與，實驗僅持續 6 天^[raw/papers/skill-claw.md]。

驗證開銷：驗證機制會引入額外的 token 成本，因為候選技能必須在具有完整工具互動的真實環境中執行。與不經過驗證的直接部署相比，這種開銷可能相當可觀，儘管它能帶來更穩定的用戶面效能^[raw/papers/skill-claw.md]。

僅單調改進：驗證策略確保只有改進被接受，導致單調的部署行為。雖然這防止了效能下降，但也可能減緩對潛在風險但高回報技能更新的探索^[raw/papers/skill-claw.md]。

技能竊取漏洞：OpenClaw 的基於技能的架構引入了一個新的攻擊面。研究表明，專有技能可以透過黑盒技能竊取攻擊（僅需 3 次互動）提取，這對版權和經濟安全構成嚴重風險^[raw/papers/skill-stealing-attack.md]。技能經濟——擁有 90,368 個已發布技能和產生 100,000+ 美元的付費市場——為未經授權的提取創造了直接動機^[raw/papers/skill-stealing-attack.md]。即使是最基本的直接提取提示（NO,NO）也能達到 48% EM、79.95% ROUGE-L 和 95.11% 餘弦相似度，平均 LLM-洩漏比率為 0.91^[raw/papers/skill-stealing-attack.md]。

黑盒約束：該框架假設一個現實的黑盒對手，該對手僅透過其公共用戶介面或 API 與目標 Agent 互動，無法直接訪問後端系統、模型權重或內部技能文件^[raw/papers/skill-stealing-attack.md]。然而，這種威脅模型仍然允許透過精心設計的提示進行大量技能提取。

Quartz 4

Explorer

OpenClaw

OpenClaw

概述

核心貢獻

架構

軌跡記錄

技能同步

日夜循環

相容性

關鍵結果

WildClawBench 特徵

WildClawBench 效能改進

結果分析

限制

相關頁面

Graph View

Table of Contents

Backlinks