OpenZeppelin 審計 EVMbench 發現資料污染

OpenZeppelin審計EVMbench發現資料污染

區塊鏈安全審計公司 OpenZeppelin 對 OpenAI 與 Paradigm 合作推出的智能合約安全 AI 基準測試 EVMbench 進行了獨立審計,並發現兩大嚴重問題:訓練資料污染以及至少 4 個被標記為「高危漏洞」的分類實際上屬於無效偽造。

EVMbench 的資料污染問題:AI 訓練截止日期的關鍵漏洞

EVMbench 於 2026 年 2 月中旬發布,旨在評估不同 AI 模型識別、修復和利用智能合約漏洞的能力,測試期間 AI 代理的網路存取權限被切斷,防止其從網路搜尋答案。然而,OpenZeppelin 的審計揭示了一個結構性漏洞:該基準測試是基於 2024 年至 2025 年年中期間開展的 120 次審計中篩選的漏洞,而多數頂尖 AI 模型的知識訓練截止日期同樣設定在 2025 年年中。

這意味著,AI 代理很可能在預訓練期間已接觸過 EVMbench 的漏洞報告,其記憶體中可能已儲存了所有問題的答案。OpenZeppelin 表示:「AI 安全最重要的能力是發現模型以前從未見過的程式碼中的新漏洞。」資料集規模有限進一步放大了污染對整體評估的影響。

EVMbench 審計發現的關鍵問題

訓練資料污染:AI 代理的預訓練可能已包含 EVMbench 的漏洞報告,使「零知識發現」測試失去意義

無效高危漏洞分類:至少 4 個被標記為高危的漏洞實際上無法被利用

評分系統缺陷:EVMbench 此前對 AI 發現這些偽漏洞的行為給予積分,評分基礎存在問題

資料集規模有限:進一步放大了污染對整體評估結果的影響

當前排行榜:Anthropic 的 Claude 4.6 領先,OpenAI 的 OC-GPT-5.2 和 Google 的 Gemini 3 Pro 緊隨其後

偽漏洞危機:至少 4 個高危分類被證實無效

除資料污染外,OpenZeppelin 還發現了更具體的事實錯誤。他們評估了至少 4 個被 EVMbench 歸類為高危的漏洞,發現這些漏洞實際上不存在——更關鍵的是,其描述的漏洞利用方式根本無法奏效。

「這些並非主觀上的嚴重性分歧;而是發現所描述的漏洞利用方式並未奏效,」OpenZeppelin 指出。若 AI 代理在測試中「發現」了這些偽漏洞,意味著評分系統在獎勵錯誤的結果。

OpenZeppelin 強調,這次審計並非否定 AI 在區塊鏈安全中的潛力:「問題不在於 AI 是否會改變智能合約的安全性——它肯定會。問題在於,我們用來建構和評估這些工具的資料和基準,是否與它們旨在保護的合約遵循相同的標準。」

常見問題

OpenZeppelin 對 EVMbench 的審計發現了什麼問題?

OpenZeppelin 發現兩大核心問題:一是訓練資料污染,EVMbench 的測試漏洞來自 2024 至 2025 年中的審計報告,與 AI 模型訓練截止日期重疊,這些模型可能在預訓練中已「見過」答案;二是至少 4 個高危漏洞分類屬於無效偽造,其描述的攻擊方式實際上無法執行。

資料污染為何對 AI 安全評測如此危險?

如果 AI 模型在預訓練中已接觸過基準測試的漏洞報告,它可能透過記憶體「回答」問題,而非真正的漏洞發現能力。這使整個評測失去「零知識測試」的意義,無法真實反映 AI 面對全新未知智能合約時的實際安全審計能力。

OpenZeppelin 對 AI 在區塊鏈安全領域的前景持何種態度?

OpenZeppelin 明確表示,AI 將對智能合約安全產生重大影響,但強調這種影響必須建立在可信的方法論和準確評測基礎之上。他們認為 EVMbench 的問題不是否定 AI 的信號,而是對行業標準的一次重要警示。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

假警察用刀威脅法國夫妻在$1M 比特幣搶劫中

三名偽裝成警察的嫌疑人在凡爾賽襲擊了一對夫婦,迫使他們轉移約90萬歐元的比特幣。法國當局確認了這起盜竊事件,並正在調查針對加密貨幣持有者的暴力搶劫日益增加的趨勢。

Decrypt 1小時前

韓檢被盜 320 枚比特幣「失而復得」,火速套現 2,150 萬美元繳國庫

韓國光州地檢署日前將查扣的320.8枚比特幣出售,套現316億韓元。這批比特幣最初來自2018-2021年對非法博弈平台的查緝。雖然曾因公務員失誤導致比特幣被駭客盜取,但後來駭客將比特幣歸還。當局已進行調查,也發現其他查扣比特幣遺失事件。

区块客2小時前

法國夫婦遭假冒警察持刀入室搶劫,被迫轉移約100萬美元比特幣

在3月10日,法國一對夫婦在家中遭三名假冒警察持刀闖入,被迫轉移約90萬歐元的比特幣。兩人受傷並被綁起,歹徒逃離。此案為加密貨幣“扳手攻擊”的最新實例。法國今年多起類似事件。

GateNews2小時前

國家互聯網應急中心發布 OpenClaw 安全應用風險提示,提出四項防護措施

國家互聯網應急中心發布風險提示,因OpenClaw智能體的不當使用已出現安全隱患。建議用戶強化網絡控制、加強憑證管理、嚴格管理插件來源,並關注安全更新,確保安全應用。

GateNews3小時前

Cosmos 披露安全漏洞影響部分 EVM Stack 區塊鏈,Saga 鏈已發布補丁

Gate News 消息,3 月 10 日,Cosmos Labs 在 X 平台披露,近期發現一項影響部分基於 Cosmos EVM Stack 構建區塊鏈的安全漏洞。該漏洞涉及相關功能模塊,已在生產環境中影響到 Layer 1 區塊鏈

GateNews3小時前

OpenClaw智能體更新後仍存安全風險,中國信通院發布提示

Gate News 消息,3月10日,中國信息通信研究院專家針對近期火爆的開源AI智能體OpenClaw(俗稱"龍蝦")再次發布安全提示。專家指出,儘管該智能體已更新到最新版本並能修復已知安全漏洞,但並不意味著完全消除安全風險。此前,工業和信息化部網絡安全威脅和漏洞信息共享平台已發布過相關安全風險提示。(央視新聞)

GateNews3小時前
留言
0/400
暫無留言