Gate News 消息,3 月 9 日,蘇黎世聯邦理工學院(ETH Zurich)研究團隊在論文「Can AI Agents Agree?」中測試了 LLM Agent 的拜占庭共識能力。研究背景是,在部分參與者可能作惡的條件下達成一致,是所有去中心化系統面臨的核心挑戰,區塊鏈的各類共識機制本質上都在解決拜占庭容錯問題的不同變體。
團隊使用 Qwen3-8B 和 Qwen3-14B 模型,在不同群體規模(4、8、16 個 Agent)和惡意節點比例下運行了數百次模擬。測試中,多個 Agent 通過同步全連接網絡反覆廣播提案並投票,部分 Agent 作為惡意拜占庭節點蓄意破壞。
結果顯示,即使完全沒有惡意節點,有效共識率也僅為 41.6%(Qwen3-14B 為 67.4%,Qwen3-8B 僅 15.8%)。節點越多越難達成一致,成功率從 4 個 Agent 時的 46.6% 降至 16 個時的 33.3%。加入惡意節點後共識進一步惡化,失敗主要表現為超時和收斂停滯(活性喪失),而非數值被篡改。僅在提示詞中提及「可能存在惡意節點」就讓 Qwen3-14B 成功率從 75.4% 降至 59.1%,即使實際不存在惡意節點。
論文結論認為,可靠共識尚非當前 LLM Agent 的可依賴湧現能力,對依賴穩健協調的去中心化部署應持謹慎態度。