OpenZeppelin ตรวจสอบ EVMbench พบการปนเปื้อนข้อมูล

OpenZeppelin審計EVMbench發現資料污染

บริษัทตรวจสอบความปลอดภัยบล็อกเชน OpenZeppelin ได้ดําเนินการตรวจสอบอิสระของ EVMbench ซึ่งเป็นเกณฑ์มาตรฐาน AI ด้านความปลอดภัยของสัญญาอัจฉริยะที่เปิดตัวโดย OpenAI ร่วมกับ Paradigm และพบปัญหาร้ายแรงสองประการ: การปนเปื้อนของข้อมูลการฝึกอบรมและการจําแนกประเภทอย่างน้อย 4 ประเภทที่ทําเครื่องหมายว่า “ช่องโหว่ที่มีความเสี่ยงสูง” เป็นการปลอมแปลงที่ไม่ถูกต้อง

ปัญหามลพิษของข้อมูลของ EVMbench: ช่องโหว่ที่สําคัญในกําหนดเวลาการฝึกอบรม AI

EVMbench เปิดตัวในช่วงกลางเดือนกุมภาพันธ์ พ.ศ. 2026 มีจุดมุ่งหมายเพื่อประเมินความสามารถของโมเดล AI ต่างๆ ในการระบุ แก้ไข และใช้ประโยชน์จากช่องโหว่ของสัญญาอัจฉริยะ โดยตัดการเข้าถึงอินเทอร์เน็ตของตัวแทน AI ระหว่างการทดสอบ ป้องกันไม่ให้พวกเขาค้นหาคําตอบจากอินเทอร์เน็ต อย่างไรก็ตาม การตรวจสอบของ OpenZeppelin เผยให้เห็นช่องโหว่เชิงโครงสร้าง: เกณฑ์มาตรฐานอิงตามช่องโหว่ที่คัดกรองในการตรวจสอบ 120 ครั้งที่ดําเนินการระหว่างปี 2024 ถึงกลางปี 2025 และกําหนดเส้นตายการฝึกอบรมความรู้สําหรับโมเดล AI ชั้นนําส่วนใหญ่ก็กําหนดไว้ที่กลางปี 2025 เช่นกัน

ซึ่งหมายความว่าตัวแทน AI มีแนวโน้มที่จะได้รับรายงานช่องโหว่ของ EVMbench ในระหว่างการฝึกอบรมล่วงหน้า และอาจมีคําตอบสําหรับคําถามทั้งหมดที่เก็บไว้ในหน่วยความจํา OpenZeppelin กล่าวว่า: “ความสามารถที่สําคัญที่สุดของการรักษาความปลอดภัย AI คือการค้นหาช่องโหว่ใหม่ในโค้ดที่โมเดลไม่เคยเห็นมาก่อน” ขนาดที่จํากัดของชุดข้อมูลช่วยเพิ่มผลกระทบของการปนเปื้อนต่อการประเมินโดยรวม

ประเด็นสําคัญที่ระบุโดยการตรวจสอบ EVMbench

การปนเปื้อนของข้อมูลการฝึกอบรม: การฝึกอบรมล่วงหน้าของตัวแทน AI อาจรวมถึงรายงานช่องโหว่จาก EVMbench ทําให้การทดสอบ “การค้นพบความรู้เป็นศูนย์” ไร้ความหมาย

การจําแนกประเภทช่องโหว่ที่มีความเสี่ยงสูงไม่ถูกต้อง: ช่องโหว่อย่างน้อย 4 ช่องโหว่ที่ทําเครื่องหมายว่ามีความเสี่ยงสูงไม่สามารถใช้ประโยชน์ได้จริง

ข้อบกพร่องของระบบการให้คะแนน: ก่อนหน้านี้ EVMbench ให้คะแนนกับพฤติกรรมของ AI ในการค้นพบช่องโหว่หลอกเหล่านี้ และมีปัญหากับพื้นฐานการให้คะแนน

ชุดข้อมูลมีขนาดจํากัด: ขยายผลกระทบของมลพิษต่อผลการประเมินโดยรวม

กระดานผู้นําปัจจุบัน: Claude 4.6 จาก Anthropic นํา ตามด้วย OC-GPT-5.2 ของ OpenAI และ Gemini 3 Pro ของ Google

วิกฤตช่องโหว่หลอก: การจําแนกประเภทที่มีความเสี่ยงสูงอย่างน้อย 4 ประเภทได้รับการพิสูจน์แล้วว่าไม่ถูกต้อง

นอกจากการปนเปื้อนของข้อมูลแล้ว OpenZeppelin ยังพบข้อผิดพลาดข้อเท็จจริงที่เฉพาะเจาะจงมากขึ้น พวกเขาประเมินช่องโหว่อย่างน้อย 4 ช่องโหว่ที่จัดอยู่ในประเภทที่มีความเสี่ยงสูงโดย EVMbench และพบว่าไม่มีอยู่จริง และที่สําคัญกว่านั้น ช่องโหว่ที่อธิบายไว้นั้นไม่ได้ผล

“สิ่งเหล่านี้ไม่ใช่ความแตกต่างของความรุนแรงตามอัตวิสัย แต่พบว่าช่องโหว่ที่อธิบายไว้ไม่ได้ผล” OpenZeppelin กล่าว หากตัวแทน AI “พบ” ช่องโหว่หลอกเหล่านี้ในการทดสอบ แสดงว่าระบบการให้คะแนนให้รางวัลแก่ผลลัพธ์ที่ไม่ถูกต้อง

OpenZeppelin เน้นย้ําว่าการตรวจสอบนี้ไม่ได้เป็นการปฏิเสธศักยภาพของ AI ในความปลอดภัยของบล็อกเชน: “คําถามไม่ใช่ว่า AI จะเปลี่ยนความปลอดภัยของสัญญาอัจฉริยะหรือไม่ แต่จะเป็นอย่างแน่นอน คําถามคือข้อมูลและเกณฑ์มาตรฐานที่เราใช้ในการสร้างและประเมินเครื่องมือเหล่านี้เป็นไปตามมาตรฐานเดียวกับสัญญาที่ออกแบบมาเพื่อปกป้องหรือไม่”

คําถามที่พบบ่อย

การตรวจสอบ EVMbench ของ OpenZeppelin พบปัญหาอะไรบ้าง

OpenZeppelin พบปัญหาหลักสองประการ: ประการแรก มลพิษของข้อมูลการฝึกอบรม ช่องโหว่ในการทดสอบ EVMbench จากรายงานการตรวจสอบตั้งแต่กลางปี 2024 ถึง 2025 ทับซ้อนกับกําหนดเวลาการฝึกอบรมโมเดล AI โมเดลเหล่านี้อาจ “เห็น” คําตอบในการฝึกอบรมล่วงหน้า ประการที่สอง การจําแนกประเภทช่องโหว่ที่มีความเสี่ยงสูงอย่างน้อย 4 ประเภทเป็นการปลอมแปลงที่ไม่ถูกต้อง และวิธีการโจมตีที่อธิบายไว้นั้นไม่สามารถทําได้จริง

เหตุใดมลพิษของข้อมูลจึงเป็นอันตรายต่อการประเมินความปลอดภัยของ AI

หากโมเดล AI ได้รับรายงานช่องโหว่ที่เปรียบเทียบในการฝึกอบรมล่วงหน้า โมเดล AI อาจ “ตอบ” คําถามในหน่วยความจํามากกว่าความสามารถในการค้นพบช่องโหว่ที่แท้จริง สิ่งนี้ทําให้การประเมินทั้งหมดสูญเสียความหมายของ “การทดสอบความรู้เป็นศูนย์” และไม่สามารถสะท้อนถึงความสามารถในการตรวจสอบความปลอดภัยที่แท้จริงของ AI ได้อย่างแท้จริงเมื่อต้องเผชิญกับสัญญาอัจฉริยะใหม่และไม่รู้จัก

OpenZeppelin มีมุมมองอย่างไรเกี่ยวกับอนาคตของ AI ในการรักษาความปลอดภัยบล็อกเชน?

OpenZeppelin ชี้แจงอย่างชัดเจนว่า AI จะส่งผลกระทบอย่างมากต่อความปลอดภัยของสัญญาอัจฉริยะ แต่เน้นย้ําว่าผลกระทบนี้ต้องขึ้นอยู่กับวิธีการที่น่าเชื่อถือและการประเมินที่ถูกต้อง พวกเขาเชื่อว่าปัญหาของ EVMbench ไม่ใช่สัญญาณให้ปฏิเสธ AI แต่เป็นคําเตือนที่สําคัญต่อมาตรฐานอุตสาหกรรม

ดูต้นฉบับ
news.article.disclaimer

btc.bar.articles

มอร์นิ่งเมอร์: ระวังโปรแกรมขยาย Chrome ของ imToken ปลอม

PANews 6 มีนาคม ข่าวสาร, ชีฟด้านความปลอดภัยข้อมูลของ Slow Fog Technology pds ได้ออกเตือนให้ระวังส่วนขยาย Chrome ของ imToken ปลอม ในร้านค้าแอป Chrome มีส่วนขยาย Chrome ของ imToken ปลอมที่จะแอบล่อลวงเพื่อขโมยวลีเมล็ดพันธุ์และกุญแจส่วนตัว

GateNews3 ชั่วโมง ที่แล้ว

น่าหัวเราะ》นักต้มตุ๋นเกาหลีที่เสียชีวิตไปแล้ว 7 ปี กลับฟื้นคืนชีพ ศาลขายคริปโตเพื่อชดเชยเหยื่อ

อาชญากรชาวเกาหลีใต้คนหนึ่งที่ถูกประกาศว่าเสียชีวิตไปเจ็ดปีแล้ว ถูกส่งตัวกลับประเทศในที่สุด ศาลได้ยกเลิกการประกาศหายตัวไปของเขา จากนั้นทรัพย์สินที่ถูกระงับไว้ประมาณ 6 หมื่นดอลลาร์สหรัฐถูกนำไปชำระหนี้ให้กับผู้เสียหาย เหตุการณ์นี้เปิดเผยช่องโหว่หลายประการในระบบยุติธรรมของเกาหลีใต้ และก่อให้เกิดการวิพากษ์วิจารณ์อย่างกว้างขวางเกี่ยวกับการจัดการทรัพย์สินดิจิทัล รัฐบาลจึงตัดสินใจดำเนินการปฏิรูปอย่างครอบคลุม

動區BlockTempo3 ชั่วโมง ที่แล้ว

FBI จับกุมผู้ต้องสงสัยในคดีโจรกรรมคริปโตเคอร์เรนซีจากสำนักงานตำรวจ สาเหตุการโจรกรรมมูลค่า 46 ล้านดอลลาร์เปิดเผยแล้ว

เอฟบีไอของสหรัฐอเมริกาได้จับกุม John Daghita ที่เกาะเซนต์มาร์ติน ในข้อหาลักลอบเข้าถึงคริปโตเคอร์เรนซีมูลค่า 46 ล้านดอลลาร์ที่ดูแลโดยสำนักงานตำรวจแห่งรัฐ เหตุการณ์นี้เกิดจากการติดตามของนักสืบบนเครือข่าย ZachXBT ซึ่งเปิดเผยช่องโหว่ในการดูแลทรัพย์สินดิจิทัลของรัฐบาล และก่อให้เกิดข้อสงสัยเกี่ยวกับความปลอดภัยของการฝากทรัพย์สินกับบุคคลที่สาม ขณะนี้ยังไม่สามารถยืนยันได้ว่าทรัพย์สินที่ถูกโจรกรรมได้ถูกกู้คืนหรือไม่

MarketWhisper3 ชั่วโมง ที่แล้ว

PsiQuantum ศูนย์คำนวณควอนตัมเริ่มก่อสร้าง ขนาดอาจสามารถแฮ็กบิทคอยน์ได้

PsiQuantum ในชิคาโก้ได้เริ่มก่อสร้างสถานีควอนตัมมูลค่าหลายล้านแห่งอย่างเป็นทางการ ร่วมมือกับ NVIDIA วางแผนสร้างคอมพิวเตอร์ควอนตัมที่ทรงพลัง สถานีนี้สามารถท้าทายเทคโนโลยีการเข้ารหัสของบิทคอยน์ กระตุ้นการอภิปรายด้านความปลอดภัยทางเครือข่าย การประเมินความเสี่ยงของคอมพิวเตอร์ควอนตัมแสดงให้เห็นว่า กระเป๋า UTXO ในช่วงเริ่มต้นเป็นจุดอ่อนที่สุด บางผู้เชี่ยวชาญเชื่อว่าในสิบปีข้างหน้า คอมพิวเตอร์ควอนตัมจะไม่ส่งผลกระทบอย่างมีนัยสำคัญต่อบิทคอยน์ PsiQuantum เน้นย้ำว่าไม่ได้มีเจตนารุกรานบิทคอยน์ แต่ความเสี่ยงจากการแพร่กระจายเทคโนโลยียังคงต้องให้ความสนใจ

MarketWhisper4 ชั่วโมง ที่แล้ว

HypurrFiเปิดเผยช่องโหว่ "ความคลาดเคลื่อนในการปัดเศษ" ของเวอร์ชันก่อนหน้า Aave V3 ได้ระงับการเพิ่มสินเชื่อในตลาด XAUT0 และ UBTC แล้ว

HyperEVM's HypurrFi ได้ประกาศบนแพลตฟอร์ม X เวอร์ชันก่อนหน้า Aave V3 3.5 มีช่องโหว่ "ความผิดพลาดในการปัดเศษ" ผู้โจมตีสามารถใช้ช่องโหว่นี้ในการดึงเหรียญพื้นฐาน ตลาดที่ได้รับผลกระทบได้ระงับการดำเนินการที่เกี่ยวข้อง ความปลอดภัยของเงินทุนของผู้ใช้ไม่มีความเสี่ยง ทีมงานกำลังร่วมมือกันแก้ไขปัญหา

GateNews4 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น