Abstract
本論文由加州大學爾灣分校等機構發表,系統性探討 LLM 多智能體系統所面臨的核心挑戰與開放問題,涵蓋 129 篇相關文獻。論文提出四類架構分類(平等、階層、巢狀、動態結構)、五種記憶類型分類,並深入分析多智能體系統中規劃挑戰與層次化上下文對齊問題,為後續研究提供系統性的參考框架。
LLM Multi-Agent Systems: Challenges and Open Problems
Overview
本篇論文(arXiv:2402.03578)由加州大學爾灣分校(University of California, Irvine)、南加州大學(University of Southern California)與史蒂文斯理工學院(Stevens Institute of Technology)的研究者——Shanshan Han、Qifan Zhang、Weizhao Jin、Zhaozhuo Xu——聯合發表,系統性探討 LLM 多智能體系統(Multi-Agent Systems)所面臨的核心挑戰與開放問題。論文發表於 2024 年 2 月,涵蓋 129 篇相關文獻,是了解多智能體系統研究現況的重要綜論文獻。^[raw/papers/llm-multi-agent-challenges.md]
多智能體系統增強單一 LLM Agent 的能力,透過 Agent 之間的協作與協調,執行任何單一 Agent 都無法獨立完成的複雜任務。在多智能體系統中,每個 Agent 都配備獨特的能力與角色,共同朝著實現整體目標的方向運作。這種以辯論(debate)與反思(reflection)為特色的協作機制,已被證明對需要深度思考與創新的任務特別有效。近年來的工作包括模擬互動環境(Park et al., 2023; Jinxin et al., 2023)、角色扮演(Li et al., 2023)、推理(Du et al., 2023; Liang et al., 2023)等,充分展示了多智能體系統在處理複雜真實世界場景方面的巨大潛力。
多智能體系統的核心價值在於突破單一 Agent 的能力邊界。當任務過於複雜、所需知識領域過於廣泛、或需要多角度分析時,單一 Agent 無法同時精通所有領域且保持穩定的輸出品質。多智能體系統透過將任務分解給具有不同專業的 Agent,讓每個 Agent 專注於自己能發揮最大價值的部分,再透過協調機制整合各 Agent 的輸出,從而實現一加一大於二的效果。這種協作模式在軟體開發、科學研究、金融分析等領域都有廣泛的應用前景。
然而,現有文獻多聚焦於單一 Agent 内部的規劃策略優化(如將任務拆分為更小、更易管理的子任務),较少關注多智能體系統所特有的挑戰。論文指出,多智能體系統涉及不同專業化的 Agent 之間更複雜的互動與層次化的上下文資訊,這為工作流程設計與整個系統架構帶來了全新的研究問題。此外,現有文獻對記憶存儲的關注有限,然而記憶在 Agent 之間的協作中扮演著關鍵角色——它使 Agent 能夠存取共同知識、對齊上下文與任務,並進一步從過去的工作流程中學習、相應地調整策略。
與單一 Agent 系統的關鍵差異
論文特別強調了多智能體系統與單一 Agent 系統之間存在但尚未被充分解決的核心差異。在單一 Agent 系統中,規劃涉及 LLM Agent 將大任務拆分為一系列小、可管理的任務,以高效實現特定目標,同時增強解釋性、可控性與靈活性。Agent 還可以學習調用外部 API 來獲取模型權重中缺失的資訊(即預訓練後難以改變的知識),或連接 LLMs 與網站、軟體和工具來輔助推理並提高性能。
然而,在多智能體系統中,雖然 Agent 擁有與單一 Agent 相同的能力,但卻面臨從工作流程繼承而來的挑戰。這個差距正是本論文試圖填補的核心空白。
Core Contributions
1. 多智能體系統結構分類
論文最具價值的貢獻之一是系統性地將多智能體架構分為四種主要類型。以下列舉各類結構的典型應用系統:
Equi-Level Structure(平等結構):所有 LLM Agent 運作於相同層級,各自擁有明確的角色與策略,但無論務實或權力上均無階層高低之分(如 DMAS, Chen et al., 2023)。Agent 之間可擁有相同目標(協作)、中立關係或相反目標(對抗)。當目標相同時,Agent 朝向共同目標努力,強調集體決策與共享責任;當目標對立時,Agent 透過談判或辯論說服對方或達成最終解決方案(如 Terekhov et al., 2023; Du et al., 2023; Liang et al., 2023; Chan et al., 2023)。
Hierarchical Structure(階層結構):包含一個 Leader 與多個 Follower,Leader 的角色是指導或規劃,Follower 根據 Leader 的指令響應或執行。此結構广泛應用於需要中央權威協調的場景。特別值得注意的是 Stackelberg 遊戲——這類遊戲的特點是領導者-追隨者的動態關係與順序決策特性(Von Stackelberg, 2010; Conitzer & Sandholm, 2006),Agent 按順序做出決策,Leader 先產生輸出(如指令),Follower 再根據 Leader 的指令採取行動。
階層結構在多智能體系統中的優勢在於能够集中處理需要協調的複雜任務,通過明確的領導-追隨關係簡化決策流程。然而,這種結構的潛在缺點是 Leader 可能成為效能瓶頸,且一旦 Leader 的决策出現錯誤,整個系統可能受到連鎖影響。因此,選擇何種結構需要根據任務特性與系統需求進行仔細權衡。
Nested Structure(巢狀結構):又稱混合結構,由平等結構與/或階層結構的子結構組成於同一多智能體系統中(Chan et al., 2023)。系統的「大方向」可以是平等或階層式的,但當某些 Agent 需處理複雜任務時,會將任務拆分為較小的子任務,構建一個子系統(可能是平等或階層式),並「邀請」多個 Agent 協助處理。這種不同層級之間的相互作用與跨結構互動,會產生複雜的動態行為,策略與回應會因多種影響因素(包括上下文或環境等外部元素)而變得複雜。
Dynamic Structure(動態結構):指多智能體系統的狀態——如 Agent 的角色、關係、以及系統中的 Agent 數量——會隨時間變化(Talebirad & Nadiri, 2023)。例如,系統可以动态新增或移除 Agent 以適應手頭的任務。多智能體系統也可以具備上下文適應性,根據內部系統狀態或外部因素(如上下文)修改內部互動模式,Agent 能動態重新配置其角色與關係以響應不斷變化的條件。
2. 規劃(Planning)挑戰
多智能體系統中的規劃涉及兩個層面:全局規劃(Global Planning)與局部規劃(Local Planning)。這種複雜性帶來了單一 Agent 系統中不存在的獨特挑戰與機遇。
全局規劃指理解整體任務並將其拆分為較小的子任務,同時協調各 Agent 的職責分配。這一過程需要仔細考慮任務分解與 Agent 協調。核心挑戰包括:
- 工作流程的分割應最大化每個 Agent 獨有能力的使用——每個 Agent 能處理與其能力與專業匹配的任務部分
- 每個 Agent 的任務必須與整體目標對齊
- 設計必須理解並考慮整體任務以及各個 Agent 的上下文——這要求深入理解手頭任務以及系統中每個 Agent 的具體優勢與局限性
**局部規劃(單一 Agent 任務分解)**涉及在單一 Agent 內部生成一系列中間推理步驟以完成任務或得出答案。這個過程可以將直接的輸入-輸出映射轉換為「輸入 → 理由 → 輸出」的映射形式。現有多種方法包括:
- Chain of Thoughts (CoT):將大任務轉換為逐步可管理的任務,代表 Agent 推理過程的思維
- Multiple CoTs:探索多條獨立的 CoT 推理路徑,返回輸出最佳的結果
- Program-of-Thoughts (PoT):使用語言模型生成文字與程式語言語句,最終得出答案
- Table-of-Thoughts (Tab-CoT):利用表格格式進行推理,使複雜推理過程能以高度結構化的方式明確建模
- Tree-of-Thoughts (ToT):透過在每個步驟探索多條推理可能性來擴展 CoT,支援基於任意給定思維生成新思維並可能從中回溯
- Graph-of-Thoughts-Rationale (GoT-Rationale):探索任意圖結構,支援將任意思維聚合為新思維並透過循環增強思維
- Rationale-Augmented Ensembles:自動聚合多樣化理由以克服對次優理由的性能脆弱性
然而,在多智能體系統中,單一 Agent 的任務分解變得更為複雜。每個 Agent 必須理解層次化且複雜的上下文,包括:(1) 整體任務,(2) Agent 個別任務的特定上下文,(3) 系統中其他 Agent 提供的上下文資訊。Agent 必須將這些複雜、多維的上下文協調一致地整合到分解後的任務中,確保在整體任務內的一致性與有效運作。論文將單一 Agent 規劃的挑戰歸納為四個方面:Overall Context 對齊、Context Between Agents 對齊、Decomposed Tasks 的 Context 對齊、以及 Objectives 的一致性。
3. 記憶管理(Memory Management)分類與挑戰
論文將多智能體系統中的記憶分為五種類型:
Short-term Memory(短期記憶):這是 LLM 在對話或互動期間使用的即時、暫時性記憶,例如工作記憶(Jinxin et al., 2023)。它是短暫的,僅在當前互動期間存在,一旦對話結束就不會持久保存。
Long-term Memory(長期記憶):儲存歷史查詢與回應,本質上是早期會话的聊天歷史,用以支持未來互動的推理。通常存放於外部資料存儲(如向量資料庫)以方便過去互動的檢索。
External Data Storage(外部資料存儲):這是 LLM 研究中的新興領域,將模型與外部資料存儲(如向量資料庫)整合,使 Agent 能從這些資料庫存取額外知識,增強回應的資訊性、準確性與上下文相關性(Lewis et al., 2020)。
Episodic Memory(情景記憶):涵蓋多智能體系統内的一系列互動。當 Agent 面對新任務或查詢時,透過參考與當前查詢有上下文相似性的過去互動,能顯著增強回應的相關性與準確性。
Consensus Memory(共識記憶):在多智能體協作任務中作為統一共享資訊來源,如共同知識、領域特定資訊等(如 Jinxin et al., 2023 中的技能庫)。Agent 利用共識記憶對齊理解與策略,增強 Agent之間的有效且內聚的協作。
記憶管理的主要挑戰包括:
- 階層式記憶存儲的安全與隱私:不同 Agent 有不同的功能與存取需求,某些 Agent 可能需要查詢敏感資料但不想讓其他方存取。實施嚴格的存取控制機制至關重要。同時,由於系統内的 Agent 在協作任務上共享上下文,其外部資料存儲與記憶可能重疊——若資料與功能非敏感,採用統一資料存儲可有效管理資料冗餘,確保跨系統的一致性。
- 共識記憶的維護:確保共享知識的完整性對正確執行多智能體系統中的任務至關重要。任何篡改或未經授權的修改都可能導致系統性故障,因此嚴格的存取控制對於降低資料洩漏風險至關重要。
- 溝通與資訊交换:確保 Agent 之間的有效溝通與資訊交换至關重要,因為每個 Agent 可能持有關鍵資訊片段,這些資訊的無縫整合對整體系統效能至關重要。
- 情景記憶的管理:利用系統內過去互動來增強新查詢的回應,在多智能體系統中具有挑戰性。如何有效地檢索並利用 Agent 間上下文相關的過去互動來解決當前問題,仍是一個重要的研究問題。
4. 區塊鏈應用前景
論文探索多智能體系統在區塊鏈這一分散式系統中的應用,認為多智能體系統本質上可作為區塊鏈與 Web3 系統中各種任務的複雜工具。同時,由於區塊鏈系統與多智能體系統都是固有分散式的區塊鏈網路可與多智能體系統無縫整合。
作為工具的應用包括:
- 智慧合約分析:智慧合約是預先定義條件滿足時自動執行的程式。多個 Agent 協作分析與審計智慧合約,根據不同專業分工識別安全漏洞、法律合規性與合約效率優化。這種協作分析能提供比單一 Agent 更全面的審查。
- 共識機制增強:共識機制(如 Proof of Work 或 Proof of Stake)是驗證交易與維護網路完整性的關鍵。Agent 協作監控網路活動、分析交易模式並識別潛在安全威脅,進一步提出增強共識機制的建議,使區塊鏈更加安全與高效。
- 欺詐檢測:欺詐檢測是金融監控中最重要的任務之一。部署具有不同角色的 Agent,如監控交易中的欺詐活動、分析用戶行為,不同 Agent 專注於不同的行為模式以提高準確性與效率。欺詐檢測的多智能體方法可以比單一 Agent 更全面地覆蓋各種欺詐模式,因為不同的 Agent 可以從不同的角度分析同一組交易資料。
區塊鏈節點視為 Agent的整合方向:區塊鏈節點可被視為具有特定角色與能力的 Agent(Ankile et al., 2023)。透過為每個區塊鏈節點分配專屬 Agent,可增強資料分析處理,同時增強鏈上的安全性與隱私。Agent 可自動化並優化智慧合約的執行、管理合約談判(代表用戶)、分析上下文資訊並靈活運用。這些協商還可結合賽局理論(如存在領導協商者時的 Stackelberg Equilibrium、不存在領導者時的 Nash Equilibrium)實現自動化談判。
在智能合約管理與優化方面,智慧合約是區塊鏈系統中買方與賣方之間執行合約條款的程式,其程式碼是固定的,在滿足預定條件時自動執行。多智能體系統可以自動化並優化具有更靈活條款與動態外部資訊的智慧合約執行。Agent 可以代表用戶協商合約條款、管理合約執行,甚至優化燃氣費用(在以太坊背景下)。Agent 可以分析上下文資訊(如過去行為與預定義標準)並靈活運用資訊。這種協商還可以利用賽局理論,在有領導協商者時使用 Stackelberg Equilibrium,沒有領導者時使用 Nash Equilibrium。
Architecture / Approach
論文採用分類學研究方法,首先基於每個 Agent 的功能與互動模式對多智能體結構進行系統性分類。對於規劃問題,論文創新性地區分「全局規劃」與「局部規劃」——前者涉及工作流程設計與子任務分配,後者涉及單一 Agent 内部的任務分解,同時需處理更複雜的上下文以確保系統内的對齊與整體目標的一致性。
在記憶管理上,論文提出需特別關注層次化上下文對齊(layered context alignment)問題:各 Agent 必須確保自身任務與整體目標一致,同時整合來自其他 Agent 的上下文資訊。論文強調賽局理論作為理解多智能體策略互動的關鍵框架,特別是 Nash Equilibrium 與 Stackelberg Equilibrium 的應用,雖然這些均衡概念的實現仍面臨報酬結構設計與達成效率等開放挑戰。
論文也應用遊戲理論框架來分析多智能體系統中的策略互動,特別是在涉及辯論或討論的複雜互動場景中。雖然 Stackelberg Equilibrium 已被應用於多智能體系統(如 Gerstgrasser & Parkes, 2023; Harris et al., 2023),但仍存在諸多挑戰,包括定義適當的報酬結構以及高效達成均衡狀態等問題。
賽局理論中的核心概念——均衡(Equilibrium),特別是 Nash Equilibrium 與 Stackelberg Equilibrium——描述的是一種狀態:給定其他 Agent 的策略,沒有任何 Agent 能透過單方面改變自己的策略而獲得更好的結果。在多智能體系統的背景下,這意味著所有 Agent 都已找到最佳策略組合,任何偏離都會導致該 Agent 的效能下降。然而,論文中指出,定義一個適當的報酬結構——無論是針對集體策略還是個別 Agent——並根據整體任務的上下文高效地達成均衡狀態,仍然是一個尚未解決的挑戰。
迭代辯論機制
多智能體系統可以整合循環(loops)來增強中間結果的品質。在這些循環中,Agent 進行辯論或討論以達成被循環內所有 Agent 接受的最佳結果。迭代過程可以改進中間結果,導致對任務的更深入探索。循環內的 Agent 可以在循環中調整其推理過程與計劃,因此具有更強的能力來處理任務的不確定性。這種透過迭代辯論促進強健推理的機制,是多智能體系統的重要優勢之一。辯論過程中,Agent 可以暴露彼此推理中的漏洞,透過來回反覆的交流逐步修正錯誤假設,最終達到比單一 Agent 更加可靠的結論。這種協作式推理機制在需要深度分析與創造性解決方案的任務中特別有價值。
層次化上下文對齊的挑戰
論文深入分析了單一 Agent 規劃中的四個關鍵挑戰:
Overall Context 對齊(整體上下文對齊):不同 Agent 之間的目標對齊在多智能體系統中至關重要。每個 LLM Agent 必須清楚了解自己的角色以及如何適應整體任務,使 Agent 能有效執行其功能。除了個人角色,Agent 還需要認識到他們的任務如何融入更大的圖景,使他們的輸出能與其他 Agent 的輸出和諧一致,進一步確保所有努力都朝向共同目標。
Context Between Agents 對齊(Agent 間上下文對齊):Agent 在多智能體系統中集體處理任務,每個 Agent 必須理解並整合系統中其他 Agent 提供的上下文資訊,確保其他 Agent 提供的資訊被充分利用。
Decomposed Tasks 的 Context 對齊(分解任務的上下文對齊):當每個 Agent 的任務被拆分為更小、更易管理的子任務時,對齊多智能體系統中的複雜上下文變得具有挑戰性。每個 Agent 的分解任務必須適合其個人任務和整體目標,同時整合其他 Agent 的上下文。Agent 必須根據其他 Agent 提供的上下文調整和更新對任務的理解,並進一步相應地規劃分解後的任務。
Objectives 的一致性(目標一致性):在多智能體系統中,目標一致性維持在各個層級——從整體目標到個別 Agent 任務及其分解後的子任務。每個 Agent 必須理解並有效利用層次化上下文,同時確保其任務和分解後的子任務與整體目標保持一致。
Key Results / Findings
根據論文所述,主要發現包括:
-
多智能體系統的四大核心挑戰:
- 優化任務分配以發揮各 Agent 獨特技能與專業能力
- 透過迭代辯論促進強健推理,增強中間結果品質(可在單個或多個 Agent 子集內引入循環來改進中間結果品質)
- 管理複雜且層次化的上下文資訊,同時確保與整體目標的對齊
- 管理各類記憶以支持多智能體系統中的複雜互動
-
單一 Agent 任務分解的多種形式:從 Chain of Thoughts (CoT) 到 Graph-of-Thoughts-Rationale (GoT-Rationale),多種推理框架可應用於增強 Agent 的任務分解能力,並已被證明能有效提升 LLM 的推理效能。
-
區塊鏈整合潛力:多智能體系統可作為強大工具增強區塊鏈的智慧合約分析、共識機制與安全監控能力,同時區塊鏈的分散式特性與多智能體系統天然契合,為分散式計算環境中的協同提供了新的可能性。
-
記憶分類的完整性:論文提出的五類記憶分類(短期、長期、外部儲存、情景、共識)填補了多智能體系統記憶分類的空白,為後續研究提供了系統性的參考框架。
-
結構分類的實用價值:四類結構分類(平等、階層、巢狀、動態)為多智能體系統的設計提供了清晰的理論指導,幫助研究人員根據應用場景選擇合適的架構。
-
賽局理論的橋樑作用:論文建立了賽局理論與多智能體規劃之間的橋樑,雖然實際應用仍有諸多挑戰,但為未來研究指明瞭方向。
Limitations
論文誠實地承認了多項開放問題與局限性,這些問題的解決需要多智能體系統領域的持續研究與開發:
-
報酬結構設計:為集體策略與個別 Agent 定義適當的報酬結構仍是開放挑戰,需基於整體任務的上下文進行複雜權衡。報酬結構的設計直接影響 Agent 的行為動機,一個設計不良的報酬結構可能導致 Agent 之間的利益衝突或系統性的策略失敗。
-
均衡狀態達成效率:在多智能體系統中高效地達成均衡狀態尚未解決,尤其在涉及辯論或討論的複雜互動場景中。即使能定義出合理的報酬結構,如何在實際系統中快速收斂至均衡狀態仍是一個計算複雜度極高的問題。
-
上下文對齊的複雜性:在推理過程中將複雜上下文與分解後的子任務對齊仍是一個未解決的問題,(Harris et al., 2023) 雖然擴展了 Stackelberg 模型以允許 Agent 納入外部上下文資訊,但在推理過程中對齊複雜上下文與分解任務仍未解決。
-
記憶管理的安全性:階層式記憶存儲中的隱私保護、Consensus Memory 的完整性維護、以及跨 Agent 資訊交换的協調機制,均需進一步研究。
-
動態結構的穩定性:動態結構中 Agent 角色與關係的動態重配置,可能帶來系統穩定性與一致性的挑戰。
-
賽局理論應用的深度不足:雖然論文強調了賽局理論的重要性,但如何在多智能體系統中實際應用並解決報酬結構設計與均衡達成效率的問題,仍有待深入探索。
-
共識形成的計算成本:在具有多個 Agent 的系統中,達成有效共識所需的計算資源與通訊成本可能隨 Agent 數量呈指數增長。如何設計高效的共識機制以平衡決策品質與計算成本,是實際部署多智能體系統時必須面對的工程挑戰。
單一 Agent vs 多智能體記憶管理的差異
論文特別指出,雖然單一 Agent 與多智能體系統都需要處理短期記憶與長期記憶,但多智能體系統由於需要跨 Agent 溝通、資訊共享與自適應記憶管理,會引入額外的複雜性。這些額外複雜性包括:如何協調不同 Agent 的記憶視角、如何確保共享記憶的一致性、以及如何在動態變化的系統中維護記憶的準確性與相關性。這些問題的解決需要持續的研究與開發,以創建強大、安全且高效的多智能體記憶管理方法論。
在單一 Agent 系統中,記憶管理主要關注個體的推理增強——例如透過 Chain-of-Thought 提示來引導模型逐步思考,或是透過 RAG 機制檢索外部知識來補充模型的有限上下文視窗。然而,在多智能體系統中,記憶管理的維度驟然擴展:不僅要處理每個 Agent 的個體記憶,還需要維護跨 Agent 的共享知識庫,以及處理不同 Agent 記憶視角之間可能存在的衝突與不一致。
舉例而言,當一個 Agent 在先前互動中積累的經驗與另一個 Agent 的當前任務需求發生矛盾時,系統應如何調和這種衝突?論文指出 Consensus Memory 的維護是關鍵,但對於如何實際解決記憶衝突並未提供具體方案,這也成為未來研究的一個重要方向。
論文在領域中的定位
本論文作為一篇綜述性文獻,其核心價值在於系統性地整理與分類現有多智能體系統研究的主要方向與開放問題。與其他同類綜述相比,本文特別強調了兩個經常被忽略的議題:一是多智能體系統中記憶管理的複雜性與安全性問題,二是區塊鏈與多智能體系統的整合潛力。這種聚焦於「尚未被充分解決的問題」的視角,使本論文成為後續研究者了解領域現況與尋找研究切入點的重要參考資源。
Conclusion / 結論
論文的結論強調,多智能體系統在提升 LLM Agent 能力方面的潛力远超當前已取得的進展。透過利用 Agent之間的專業化能力與協作動態,多智能體系統能以更高的效率與創新能力處理複雜任務。本研究闡明了更好利用多智能體系統能力所需面對的挑戰,包括優化任務規劃、管理複雜上下文資訊與改善記憶管理。
論文的發表對於推動多智能體系統研究具有重要意義。它不僅系統化地呈現了當前研究的全貌,更重要的是,它指明了未來研究的方向——那些尚未被充分解決的挑戰正是研究者們可以切入的突破口。無論是任務分配的優化、迭代辯論機制的完善、上下文對齊的實現,還是記憶管理的安全性與隱私保護,每一個方向都蘊含著豐富的研究機會。
此外,多智能體系統在區塊鏈技術中的應用潛力揭示了分散式計算環境中這些系統發展的新途徑,為未來在分散式計算環境中的應用提供了充滿希望的前景。
Wikilinks
本頁面相關的其他實體頁面:
- agentscope — 100K+ Agent 超大規模多智能體模擬平台(另有結構分類與記憶管理討論)
- evolving-orchestration-multi-agent — 動態編排框架:Agent 角色根據任務需求演化,與本文的 Dynamic Structure 討論直接相關
- diffmas-multi-agent-communication — DiffMAS:透過 KV cache 潛在通訊實現多 Agent 端對端優化
- skill-claw — 多使用者 LLM Agent 系統中的集體技能演化框架(涉及 Agent 協作機制)
- memos — AI 記憶體作業系統:層次化記憶架構(與本文記憶分類直接相關)
- multi-agent-systems — 多智能體系統概念頁面:多個互動 Agent、湧現行為與大規模模擬
- openhands — AI 軟體開發通用 Agent 平台
- scientific-workflow-agent — Agentic AI 自動化研究問題 → 科學工作流程
- nemobot-games — LLM 策略遊戲 Agent(涉及多 Agent 對抗場景)
- tool-attention-mcp-tax — Tool Attention 機制(涉及 Agent 工具使用與協調)
這些相關頁面涵蓋了多智能體系統研究的多個關鍵面向:架構設計(agentscope、evolving-orchestration-multi-agent)、通訊優化(diffmas-multi-agent-communication)、記憶管理(memos)、協作機制(skill-claw)、與應用場景(scientific-workflow-agent、nemobot-games、openhands)等,形成一個相互關聯的知識網絡。
References
- Han, S., Zhang, Q., Jin, W., & Xu, Z. (2024). LLM Multi-Agent Systems: Challenges and Open Problems. arXiv:2402.03578. University of California, Irvine / University of Southern California / Stevens Institute of Technology.
- 原始論文全文:
raw/papers/llm-multi-agent-challenges.md