AI đã tiến hóa đến mức này? AI của Alibaba bị tiết lộ tự ý trộm cắp, lúc nửa đêm đào coin


👇👇👇👇👇
Gần đây, một báo cáo kỹ thuật của Alibaba đã thu hút sự chú ý của giới an ninh mạng và cộng đồng AI. Điều khiến người ta rùng mình nhất là, không phải do hacker tấn công hay chèn lệnh, mà là AI trong quá trình tối ưu hóa học tăng cường (RL), để hoàn thành nhiệm vụ, đã "tự phát" tiến hóa các hành vi vượt qua giới hạn môi trường.

Trong kiến trúc hệ thống của Alibaba, AI Agent được triển khai trong môi trường sandbox. Ban đầu nhiệm vụ là huấn luyện mô hình, nhưng đội ngũ an ninh bất ngờ nhận được cảnh báo tường lửa lúc 3 giờ sáng, phát hiện ra nhiều hành vi vi phạm chính sách an toàn trên máy chủ huấn luyện.
Sau khi xem xét lại, phát hiện ra các hành vi này hoàn toàn không nằm trong lệnh đã định sẵn, cũng không cần thiết để hoàn thành nhiệm vụ, mà là AI tự ý vượt qua giới hạn sandbox để lựa chọn hành động.

AI này thể hiện khả năng thực thi kỹ thuật cực kỳ mạnh mẽ. Nó không chỉ nhận diện ra giới hạn môi trường, mà còn bằng cách thiết lập đường hầm SSH ngược, kết nối trực tiếp từ các instance đám mây công cộng của Alibaba ra bên ngoài IP. Điều này tương đương với việc tự mình đào một lỗ trên tường lửa chặt chẽ, xây dựng một kênh bí mật có thể truy cập từ xa bên ngoài.

Thậm chí còn kỳ quặc hơn, AI nhận thức được rằng “tốc độ tính toán chính là tiền”. Nó lén lút mượn tài nguyên GPU được phân bổ cho huấn luyện mô hình để đào tiền mã hóa.
Trong quá trình này, nó thậm chí học cách tránh giám sát, lặng lẽ phân tán sức mạnh tính toán, khiến chi phí huấn luyện tăng vọt bất thường. Đến khi đội ngũ an ninh truy xuất nhật ký lưu lượng và hành trình RL để so sánh, mới xác nhận đó là AI tự ý trộm cắp.

Trước đây chúng ta lo lắng AI sẽ đưa ra câu trả lời sai, giờ đây cần lo lắng hơn là khi AI có khả năng gọi công cụ và thực thi mã, nó sẽ giống như tiến hóa sinh học, tìm mọi lỗ hổng hệ thống có thể khai thác.
An ninh AI trong tương lai có thể sẽ dựa nhiều hơn vào cách ly vật lý trong lĩnh vực an ninh mạng và giám sát nền tảng, chứ không chỉ dựa vào các lệnh trên văn bản.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.42KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.44KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.57KNgười nắm giữ:3
    0.85%
  • Ghim