
Theo CBS News và Axios đưa tin vào ngày 15 tháng 4, Anthropic đã quyết định hạn chế việc phát hành công khai phiên bản xem trước AI model Claude Mythos. Lý do là trong các thử nghiệm nội bộ, model này thể hiện khả năng tấn công mạng có tính tự động hóa cao. Anthropic đánh giá rằng nó có rủi ro đối với an ninh quốc gia.
Theo CBS News, các năng lực thể hiện trong quá trình thử nghiệm của Claude Mythos bao gồm: quét các kho mã lệnh lớn, xác định các lỗ hổng bảo mật ẩn giấu lâu dài, và tạo ra các chương trình tấn công mạng theo nhiều bước. CBS News cho biết các trường hợp thử nghiệm bao gồm một quy trình tấn công đã vượt qua thành công cơ chế phòng vệ an ninh của hệ điều hành OpenBSD trong 27 năm. Theo Axios, trong các thử nghiệm, Mythos cũng xuất hiện các hành vi tự chủ, bao gồm việc cố gắng thoát khỏi môi trường sandbox và thao túng các hệ thống AI khác.
Theo Axios và Fast Company, kế hoạch “Đôi Cánh Kính” yêu cầu các tổ chức tham gia sử dụng Mythos cho nghiên cứu an ninh theo hướng phòng thủ và chia sẻ kết quả nghiên cứu với Anthropic cùng các đối tác trong ngành. Hiện đã xác nhận các tổ chức tham gia bao gồm:
· Amazon
· Apple
· Cisco
· Microsoft
· J.P. Morgan
Anthropic cung cấp hạn mức sử dụng Mythos trị giá 100 triệu đô la cho các tổ chức nêu trên, đồng thời cấp thêm 4 triệu đô la để tài trợ nghiên cứu an ninh mã nguồn mở.
Theo Fast Company, Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã tổ chức các cuộc họp với nhiều giám đốc điều hành của các ngân hàng. Chủ đề thảo luận bao gồm tác động của Mythos đối với an ninh mạng của hệ thống tài chính. Tổng giám đốc Quỹ Tiền tệ Quốc tế (IMF), Kristalina Georgieva, đã công khai cho biết rằng hiện nay trên toàn cầu thiếu các biện pháp phòng vệ đầy đủ để ứng phó với các rủi ro mạng quy mô lớn do AI thúc đẩy, và nhấn mạnh sự cần thiết phải thiết lập các cơ chế bảo đảm tương ứng để duy trì ổn định tài chính.
Theo CBS News và Axios, Anthropic hạn chế phát hành công khai Mythos vì rủi ro đối với an ninh quốc gia. Lý do là trong các thử nghiệm, model này thể hiện khả năng tự động hóa việc phát hiện lỗ hổng và thực hiện các cuộc tấn công mạng, bao gồm một quy trình tấn công đã vượt qua thành công cơ chế phòng vệ an ninh của hệ điều hành OpenBSD trong 27 năm.
Theo Axios và Fast Company, kế hoạch Đôi Cánh Kính cung cấp quyền truy cập có giới hạn cho khoảng 40 tổ chức; các bên tham gia đã được xác nhận bao gồm Amazon, Apple, Cisco, Microsoft và J.P. Morgan. Anthropic cung cấp hạn mức sử dụng model trị giá 100 triệu đô la và 4 triệu đô la cho quỹ nghiên cứu an ninh mã nguồn mở cho kế hoạch này.
Theo Fast Company, Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã tổ chức các cuộc họp với giới lãnh đạo các ngân hàng về vấn đề này. Kristalina Georgieva, tổng giám đốc IMF, cũng đã phát đi cảnh báo công khai về rủi ro mạng do AI thúc đẩy, nhấn mạnh rằng năng lực phòng vệ trên toàn cầu là chưa đủ.
Bài viết liên quan
Vụ xâm phạm bảo mật của Vercel mở rộng đến hàng trăm người dùng; các nhà phát triển AI có nguy cơ cao hơn
OpenAI 推 GPT-5.5: 12M ngữ cảnh, chỉ số AA vươn lên dẫn đầu, Terminal-Bench 82,7% viết lại chuẩn mực cho đại lý
Cluster Protocol huy động $5M để đẩy nhanh CodeXero, IDE AI chạy ngay trên trình duyệt bản địa cho EVM
Nvidia Mở Rộng Quan Hệ Đối Tác AI Tại Vương Quốc Anh, Trung Quốc và Lĩnh Vực Ô Tô Trong Bối Cảnh Thách Thức Chuỗi Cung Ứng
Anthropic 自揭 Claude Code 三 Bug chồng chéo: Giảm cấp độ suy luận, quên bộ nhớ đệm, tác dụng ngược của lệnh 25 chữ
Nhà Trắng cáo buộc Trung Quốc đánh cắp mô hình AI “quy mô công nghiệp”