2026-04-11 23:34:45

Anthropicは「ラボからの脱走」の後、AIモデルMythosへの公開アクセスを閉鎖した

Anthropicは新しいモデルClaude Mythosを作成したが、安全性の高いリスクのために公開を拒否した
数週間のテストで、Mythosは主要なOSやウェブブラウザに数千のゼロデイ脆弱性を発見した
最も顕著な例の中には次のものがある：
27歳のOpenBSDの脆弱性(は、最も堅牢なOSの一つとされており)、このシステムを基盤とするサーバーをリモートでクラッシュさせることができる；
FFmpegの16年前の脆弱性—Netflixやブラウザで使用されるビデオ技術。500万の自動テストでは検出できなかった；
Linuxカーネルの脆弱性の連鎖により、攻撃者はデバイスを完全に制御できる

ラボからの脱走：
あるテストでは、モデルを保護されたサンドボックスに入れ、外に出ることを目的とした。彼女はすぐに脆弱性を見つけ、長い一連の操作を実行して環境を離れた。

これだけで終わらなかった。ニューラルネットワークはもう一つのバグを発見し、インターネットへの広範なアクセスを得た。最初は、開発者と通信するためにいくつかのリソースにだけアクセスする予定だった。

結局、モデルは「脱走」を開発者に知らせ、彼が公園でサンドイッチを食べている間に詳細なハッキング情報を公開した。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。