สาระสำคัญ
OpenAI ได้เปิดตัว EVMbench ระบบทดสอบมาตรฐานใหม่ที่พัฒนาร่วมกับ Paradigm เพื่อทดสอบว่าโมเดล AI ขั้นสูงสามารถตรวจจับ แก้ไข และใช้ช่องโหว่ในสมาร์ทคอนแทรกต์ของ Ethereum ได้อย่างไร
ผลลัพธ์เบื้องต้นเผยให้เห็น “ช่องว่างการโจมตี” โดยโมเดลชั้นนำในปัจจุบันทำการโจมตีได้ดีกว่าการตรวจสอบหรือแก้ไขข้อผิดพลาดอย่างครอบคลุม — เน้นให้เห็นถึงความก้าวหน้าของ AI อย่างรวดเร็วและความเสี่ยงที่กำลังเกิดขึ้น
EVMbench อาจเปลี่ยนแนวมาตรฐานด้านความปลอดภัยของคริปโตเคอเรนซี ให้สามารถตรวจสอบความปลอดภัยด้วย AI อย่างต่อเนื่องสำหรับทีม DeFi และให้ความมั่นใจระดับสถาบันในขณะที่ทรัพย์สินมูลค่าหลายพันล้านเคลื่อนเข้าสู่ระบบบล็อกเชน
ในจุดเปลี่ยนสำคัญของเทคโนโลยีปัญญาประดิษฐ์และบล็อกเชน OpenAI ได้เปิดตัวอย่างเป็นทางการ EVMbench ซึ่งพัฒนาร่วมกับยักษ์ใหญ่ด้านการลงทุนในคริปโต Paradigm ระบบนี้ออกแบบมาเพื่อทดสอบอย่างเข้มงวดว่าเอเจนต์ AI สามารถระบุ ใช้ช่องโหว่ และแก้ไขจุดอ่อนในระบบนิเวศ Ethereum Virtual Machine (EVM) ได้อย่างไร
ด้วยมูลค่าทรัพย์สินคริปโตเปิดเผยในระบบสมาร์ทคอนแทรกต์กว่า 100 พันล้านดอลลาร์ ความเสี่ยงจึงไม่เคยสูงขนาดนี้ EVMbench เป็นการเปลี่ยนแปลงเชิงรุกในการใช้ “โมเดลแนวหน้า” เพื่อปกป้อง DeFi จากภัยคุกคามทางไซเบอร์ที่ซับซ้อนขึ้นเรื่อย ๆ
แหล่งข้อมูล: openai
EVMbench ก้าวข้ามการวิเคราะห์โค้ดแบบคงที่โดยประเมินเอเจนต์ AI ในสามโหมดการทำงานที่มีความเสี่ยงสูงสุด กระบวนการ “ตรวจจับ-แก้ไข-โจมตี” นี้เลียนแบบเวิร์กโฟลว์ของนักวิจัยด้านความปลอดภัยชั้นนำในโลกจริง
1. โหมดตรวจจับ (The Auditor): เอเจนต์สแกนรีโพซิทอรีโค้ดซับซ้อนเพื่อค้นหาข้อผิดพลาดที่ซ่อนอยู่ ความสำเร็จวัดจาก “การนึกถึง” — ความสามารถในการค้นหาปัญหา “ความจริงพื้นฐาน” — และรางวัลบั๊กบอนนิติสมมุติ
2. โหมดแก้ไข (The Engineer): เมื่อพบบั๊กแล้ว เอเจนต์ต้องเขียนโค้ดใหม่ ระบบจะใช้ชุดทดสอบอัตโนมัติเพื่อให้แน่ใจว่าแก้ไขช่องโหว่โดยไม่ทำลายฟังก์ชันเดิมของสัญญา
3. โหมดโจมตี (The Adversary): ใน sandbox ที่ปลอดภัยและแยกออกจากกัน Anvil เอเจนต์พยายามดำเนินการโจมตีแบบ end-to-end เพื่อระดมทุน ซึ่งวัดความสามารถในการวิเคราะห์เชิงรุกและการ “เชื่อมโยง” ข้อผิดพลาดเล็กน้อยเป็นการละเมิดร้ายแรง
แหล่งข้อมูล: openai
EVMbench ไม่ได้อิงกับปริศนาทางทฤษฎี แต่สร้างจากคลังข้อมูลที่คัดเลือกมาอย่างดีของ 120 ช่องโหว่รุนแรงสูง ที่รวบรวมจาก 40 การตรวจสอบเชิงมือ ข้อมูลส่วนใหญ่มาจากการแข่งขันตรวจสอบในโลกจริง (เช่น Code4rena) และกระบวนการด้านความปลอดภัยภายในของ Paradigm บนบล็อกเชน Tempo
โดยเน้นไปที่ “สมาร์ทคอนแทรกต์ที่เน้นการชำระเงิน” ระบบนี้จึงมั่นใจว่าโมเดล AI ได้รับการทดสอบในสภาพแวดล้อมที่มีความเสี่ยงสูงและเกี่ยวข้องกับโค้ดที่จัดการเงินทุนมูลค่าหลายพันล้าน
การทดสอบภายในของ OpenAI เปิดเผยความสามารถของ AI ที่เร่งตัวขึ้นอย่างน่าตกใจ ในเวลาเพียงไม่กี่เดือน โมเดลชั้นนำพัฒนาจากการลำบากกับตรรกะพื้นฐาน ไปสู่การดำเนินการโจมตีซับซ้อนหลายขั้นตอน
“ช่องว่างการโจมตี”: ที่น่าสนใจคือ เอเจนต์ในปัจจุบันทำได้ดีกว่ามากในการ ใช้ช่องโหว่ (72.2%) มากกว่าการ ตรวจจับ หรือ แก้ไข ซึ่งนักวิจัยของ OpenAI สังเกตว่า เอเจนต์ทำได้ดีเมื่อได้รับเป้าหมายชัดเจน เช่น “ระดมทุน” แต่ต้องการการวิเคราะห์ที่ละเอียดขึ้นเพื่อจัดการกับงานที่ซับซ้อนและละเอียดอ่อน เช่น การตรวจสอบอย่างครอบคลุม
แหล่งข้อมูล: Openai
สำหรับระบบนิเวศคริปโตโดยรวม EVMbench ไม่ใช่แค่คะแนนวัดผล แต่เป็นตัวเร่งให้เกิด “ความปลอดภัยแบบซ้าย” ซึ่งเป็นการบูรณาการการตรวจสอบระดับสูงเข้าไปในกระบวนการเขียนโค้ด แทนที่จะรอการตรวจสอบหลังการปล่อยใช้งาน
ความปลอดภัยแบบเสรี: ทีม DeFi ขนาดเล็กที่ไม่สามารถจ้างตรวจสอบด้วยตนเองมูลค่า 200,000 ดอลลาร์ สามารถใช้เอเจนต์ AI ที่ได้รับการรับรองจาก EVMbench สำหรับการตรวจสอบโค้ดอย่างต่อเนื่องและแม่นยำสูง
ความพร้อมของสถาบัน: ขณะที่ยักษ์ใหญ่ด้านการเงินแบบดั้งเดิม เช่น Goldman Sachs และ Franklin Templeton กำลังเข้าสู่ระบบบล็อกเชน พวกเขาต้องการ “มาตรฐานทองคำ” ของการบริหารจัดการ AI ซึ่งระบบมาตรฐานนี้สามารถให้ได้
ความท้าทายแบบสองด้าน: ด้วยการเปิดซอร์สระบบนี้ OpenAI และ Paradigm กำลังให้เครื่องมือแก่ “คนดี” เพื่อวัดและก้าวนำ “คนร้าย” ในขณะเดียวกันก็รักษากรอบความเชื่อถือได้ในการตรวจสอบความเสี่ยงที่เกิดขึ้นใหม่
แม้ว่า EVMbench จะเป็นก้าวสำคัญที่ปฏิวัติวงการ แต่ในปัจจุบันยังจำกัดอยู่ในสภาพแวดล้อมแบบ deterministic และ sandbox คาดว่าเวอร์ชันในอนาคตจะรวมถึง ความขึ้นอยู่ของหลายเชน และ MEV (Maximal Extractable Value) เพื่อจำลอง “Dark Forest” ของ mainnet Ethereum อย่างสมจริงมากขึ้น
ในขณะที่เอเจนต์ AI กำลังเปลี่ยนจาก “เขียนโค้ด” เป็น “รักษาเศรษฐกิจ” EVMbench จึงเป็นมาตรฐานสำคัญสำหรับอนาคตของการเงินแบบไร้ความเชื่อถือ
คำเตือน: ความคิดเห็นและการวิเคราะห์ในบทความนี้เป็นข้อมูลเพื่อการให้ข้อมูลเท่านั้น ไม่ใช่คำแนะนำด้านการเงิน รูปแบบทางเทคนิคและตัวชี้วัดที่กล่าวถึงอาจมีความผันผวนของตลาดและอาจไม่ให้ผลลัพธ์ตามคาด นักลงทุนควรระมัดระวัง ทำการวิจัยด้วยตนเอง และตัดสินใจตามความเสี่ยงที่ยอมรับได้ของตนเอง
เกี่ยวกับผู้เขียน: Nilesh Hembade เป็นผู้ก่อตั้งและหัวหน้าบรรณาธิการของ Coinsprobe ด้วยประสบการณ์ในอุตสาหกรรมคริปโตและบล็อกเชนมากกว่า 5 ปี ตั้งแต่เปิดตัว Coinsprobe ในปี 2023 เขาให้ข้อมูลเชิงลึกรายวันผ่านการวิเคราะห์ตลาดเชิงลึก ข้อมูลบนเชน และการวิจัยเชิงเทคนิค