Trong bối cảnh công nghệ trí tuệ nhân tạo và blockchain đang hội tụ nhanh chóng, Sam Altman dẫn dắt OpenAI hợp tác cùng gã khổng lồ đầu tư tiền mã hóa Paradigm chính thức ra mắt EVMbench. Công cụ đánh giá chuẩn mới này nhằm mục đích nghiêm ngặt đánh giá khả năng của các đại lý AI trong việc phát hiện, sửa chữa, thậm chí mô phỏng các lỗ hổng rủi ro cao trong hợp đồng thông minh của Ethereum, nhằm bảo vệ an toàn cho các tài sản kỹ thuật số trị giá hàng nghìn tỷ đô la.
(Thông tin trước đó: Tiền mã hóa chưa bao giờ được thiết kế cho con người? Đối tác Dragonfly: Người dùng thực sự là AI đại lý)
(Thông tin bổ sung: Sam Altman trực tiếp tuyển dụng! Người sáng lập OpenClaw gia nhập OpenAI, AI đại lý cá nhân “sẽ sớm trở thành sản phẩm cốt lõi”)
Mục lục bài viết
Cùng với sự tiến bộ nhanh chóng của công nghệ trí tuệ nhân tạo, gần đây OpenAI thông báo hợp tác với công ty đầu tư tiền mã hóa Paradigm, chính thức ra mắt công cụ đánh giá chuẩn mới mang tên EVMbench. Công cụ này đặc biệt dùng để đánh giá hiệu suất của các đại lý AI trong lĩnh vực an toàn hợp đồng thông minh blockchain. OpenAI cho biết, bước đi này nhằm xây dựng tiêu chuẩn đánh giá AI rõ ràng hơn cho an toàn blockchain, đồng thời đáp ứng nhu cầu bảo vệ tài sản ngày càng lớn trong lĩnh vực tài chính phi tập trung (DeFi).
Hợp đồng thông minh là mã tự động thực thi được triển khai trên các blockchain tương thích với Ethereum Virtual Machine (EVM), đã trở thành nền tảng cốt lõi hỗ trợ các ứng dụng như sàn giao dịch phi tập trung, nền tảng vay mượn và thanh toán bằng stablecoin. Hiện tại, tổng giá trị các tài sản mã nguồn mở được bảo vệ bởi các hợp đồng này thường vượt quá 100 tỷ đô la. Do hợp đồng thường không thể sửa đổi sau khi lên chuỗi, bất kỳ lỗ hổng nào cũng có thể dẫn đến thiệt hại lớn về tài chính, đã xảy ra nhiều vụ tấn công nổi tiếng trong những năm qua. Vì vậy, việc kiểm tra, đánh giá và tăng cường an toàn cho hợp đồng thông minh đã trở thành một trong những thách thức cấp bách nhất của ngành công nghiệp blockchain.
EVMbench dựa trên các trường hợp thực tế, thu thập 120 lỗ hổng nghiêm trọng từ 40 dự án kiểm toán, phần lớn đến từ các cuộc thi kiểm toán mã nguồn mở như Code4rena, đồng thời bổ sung các tình huống lỗ hổng liên quan đến thanh toán trên blockchain Tempo do Paradigm hỗ trợ. Các bài kiểm tra tập trung vào ba khả năng cốt lõi:
Thông qua ba khía cạnh này, EVMbench cung cấp điểm tổng hợp theo tỷ lệ phần trăm, giúp các nhà nghiên cứu và nhà phát triển dễ dàng so sánh năng lực của các mô hình AI khác nhau trong các nhiệm vụ an toàn hợp đồng thông minh.
Trong blog chính thức, OpenAI nhấn mạnh rằng, khi khả năng đọc, viết và thực thi mã của AI ngày càng nâng cao, vai trò phòng thủ của chúng trong các môi trường có giá trị kinh tế cao sẽ ngày càng quan trọng. EVMbench không chỉ là để thử thách giới hạn của AI, mà còn khuyến khích ngành công nghiệp ứng dụng AI vào kiểm toán chủ động và tăng cường các hợp đồng đã triển khai, nhằm giảm thiểu rủi ro tổng thể.
OpenAI cũng chỉ ra rằng, tiêu chuẩn này liên quan chặt chẽ đến “Khung chuẩn bị” (Preparedness Framework) của họ, mô tả các tình huống mạng lưới có rủi ro cao, cho thấy họ đang xây dựng một chiến lược toàn diện về quản trị an toàn AI.
Việc ra mắt EVMbench đánh dấu bước chuyển của công nghệ AI từ ứng dụng phổ thông sang lĩnh vực an ninh blockchain chuyên sâu. Khi DeFi và thanh toán bằng stablecoin tiếp tục phát triển, nếu AI có thể thể hiện khả năng đáng tin cậy trong việc phát hiện và sửa chữa lỗ hổng, toàn bộ hệ sinh thái sẽ được nâng cao mức độ an toàn đáng kể. Tuy nhiên, tiêu chuẩn này cũng nhắc nhở rằng khả năng của AI trong việc khai thác lỗ hổng cần được kiểm soát chặt chẽ để tránh bị lợi dụng cho các mục đích xấu. Khi khả năng của các mô hình AI ngày càng tiến bộ, EVMbench có thể trở thành thước đo quan trọng để đánh giá “AI có đủ khả năng bảo vệ tài sản kỹ thuật số hay không”.
Bài viết liên quan
ETH 15 phút giảm 1.36%:Cảm xúc vĩ mô xấu đi và căng thẳng thanh khoản gây áp lực bán tháo
Cá mập ETH trong đợt sóng hôm nay sáng đã rút 6898.98 ETH từ một sàn CEX, trị giá 13,58 triệu USD
Dự đoán giá ngày 3/6: BTC, ETH, BNB, XRP, SOL, DOGE, ADA, BCH, HYPE, XMR
Sky liên doanh Rune mở vị thế bán khống đòn bẩy 7 lần ETH và Nasdaq 100, dự định tiếp tục tăng thêm bốn vị thế
Ví mới tạo gửi 2 triệu USDC vào Hyperliquid để mở vị thế bán khống BTC và ETH