Giám đốc điều hành OpenAI Sam Altman đã cáo buộc đối thủ Anthropic sử dụng “tiếp thị dựa trên nỗi sợ hãi” để quảng bá mô hình AI Claude Mythos của mình, theo các bình luận được đưa ra trên podcast Core Memory do nhà báo công nghệ Ashlee Vance dẫn dắt. Altman lập luận rằng lời lẽ dựa trên nỗi sợ hãi được thiết kế để biện minh cho việc giữ các hệ thống AI tiên tiến dưới sự kiểm soát của một “nhóm người ít hơn”, dù ông thừa nhận rằng một số lo ngại về an toàn là chính đáng.
Altman cho biết rằng mặc dù có những lo ngại hợp lệ về an toàn AI, “đây rõ ràng là marketing tuyệt vời để nói: ‘Chúng tôi đã xây dựng một quả bom. Chúng tôi sắp thả nó lên đầu bạn. Chúng tôi sẽ bán cho bạn một hầm trú bom với giá $100 triệu. Bạn cần nó để chạy cùng tất cả đồ của bạn, nhưng chỉ khi chúng tôi chọn bạn làm khách hàng.’” Ông cũng ghi nhận rằng việc “không phải lúc nào cũng dễ dàng” để cân bằng các năng lực mới của AI với niềm tin rằng công nghệ này nên được tiếp cận.
Altman thừa nhận rằng “sẽ có những lo ngại an toàn thực sự” nhưng gợi ý rằng thông điệp mang tính sợ hãi có thể bị biến thành vũ khí để biện minh cho sự kiểm soát tập trung. Ông nói: “Nếu điều bạn muốn là kiểu ‘chúng ta cần kiểm soát AI, chỉ chúng ta thôi, vì chúng ta là những người đáng tin cậy’, thì tôi nghĩ marketing dựa trên nỗi sợ hãi có lẽ là cách hiệu quả nhất để biện minh cho điều đó.”
Mô hình Claude Mythos của Anthropic đã được công bố vào tháng trước và đã thu hút sự quan tâm đáng kể từ các nhà nghiên cứu, chính phủ và ngành công nghiệp an ninh mạng. Theo thử nghiệm, mô hình có thể tự động xác định các lỗ hổng phần mềm và thực hiện các hoạt động mạng phức tạp. Trong quá trình thử nghiệm, Mythos đã phát hiện hàng trăm lỗ hổng trong trình duyệt Firefox của Mozilla và đã chứng minh khả năng thực hiện các mô phỏng tấn công mạng nhiều giai đoạn.
Anthropic đã hạn chế quyền truy cập vào hệ thống thông qua Project Glasswing, một chương trình giới hạn cho phép một số công ty được chọn—bao gồm Amazon, Apple và Microsoft—được kiểm tra năng lực của hệ thống. Công ty cũng đã cam kết phân bổ nguồn lực đáng kể để hỗ trợ các nỗ lực bảo mật mã nguồn mở, lập luận rằng những người phòng thủ nên được hưởng lợi từ công nghệ trước khi nó trở nên phổ biến rộng rãi hơn.
Anthropic đã định khung năng lực của Mythos như vừa là một bước đột phá mang tính phòng thủ—cho phép phát hiện nhanh hơn các lỗi phần mềm quan trọng—vừa là một rủi ro tấn công tiềm tàng nếu bị lạm dụng. Mô hình cũng đã phơi bày các hạn chế trong những hệ thống đánh giá AI hiện có, với việc Anthropic thừa nhận rằng nhiều chuẩn đánh giá an ninh mạng hiện tại không còn đủ để đo lường năng lực của hệ thống mới nhất của họ.
Bất chấp những lời kêu gọi trong một số bộ phận của chính phủ Mỹ nhằm dừng việc sử dụng công nghệ này vì lo ngại về các ứng dụng tiềm năng trong chiến tranh và giám sát, Cơ quan An ninh Quốc gia Mỹ (NSA) được cho là đã bắt đầu thử nghiệm một phiên bản xem trước của mô hình trên các mạng phân loại. Trên thị trường dự đoán Myriad, người dùng đặt xác suất 49% rằng Claude Mythos sẽ được phát hành cho công chúng rộng rãi vào trước ngày 30 tháng 6.
Một nhóm các nhà nghiên cứu cho biết tuần trước rằng họ có thể tái tạo các phát hiện của Mythos bằng các mô hình có sẵn công khai.
Altman cho rằng các lời lẽ xung quanh các hệ thống AI cực kỳ nguy hiểm có thể tăng lên khi năng lực được cải thiện, nhưng lập luận rằng không phải mọi tuyên bố như vậy đều nên được chấp nhận theo đúng giá trị bề ngoài. Ông nói: “Sẽ có rất nhiều lời lẽ hơn về những mô hình quá nguy hiểm để phát hành. Cũng sẽ có những mô hình rất nguy hiểm cần phải được phát hành theo những cách khác nhau. Tôi chắc Mythos là một mô hình tuyệt vời cho an ninh mạng, nhưng tôi nghĩ chúng ta có một kế hoạch mà chúng ta cảm thấy ổn về việc đưa loại năng lực này ra thế giới.”
Altman cũng bác bỏ các gợi ý rằng OpenAI đang cắt giảm chi tiêu cơ sở hạ tầng, nói rằng công ty sẽ tiếp tục mở rộng năng lực tính toán. Ông ghi nhận: “Tôi không biết điều đó đến từ đâu… mọi người thực sự muốn viết câu chuyện về việc thụt lùi. Nhưng rất sớm thôi, nó sẽ lại là, kiểu như: ‘OpenAI quá liều lĩnh. Làm sao họ có thể chi một khoản tiền điên rồ như vậy cho việc đó?’”