По данным мониторинга 1M AI News, Anthropic проводит тестирование новой модели под названием «Claude Mythos». Из-за ошибки в настройках системы управления контентом черновик неопубликованного блога был сохранён в открытой поисковой базе данных, что случайно раскрывает существование этой модели. Затем Anthropic подтвердил существование этой модели, назвав её «скачком вперёд в возможностях» (step change), являющейся «самой мощной моделью, которую мы создали на сегодняшний день».
Опубликованный черновик показывает, что Mythos — это совершенно новая иерархия моделей, расположенная выше серии Opus. В документе говорится, что «по сравнению с предыдущей лучшей моделью Claude Opus 4.6, эта модель значительно превосходит по результатам в тестах программирования, академического мышления и кибербезопасности». Также в черновике упоминается кодовое имя «Capybara», которое указывает на ту же базовую модель, что и Mythos.
Anthropic особенно осторожен в отношении возможностей этой модели в области кибербезопасности. В черновике отмечается, что «на сегодняшний день она значительно превосходит все остальные AI-модели по уровню кибербезопасности», а также «предвещает грядущую волну моделей, чьи уязвимости и возможности эксплуатации будут значительно превосходить скорость реагирования защитных систем». Поэтому Anthropic применяет более медленную стратегию выпуска по сравнению с прошлым: сначала ограниченно предоставляет доступ небольшому числу ранних клиентов, сосредотачиваясь на сценариях защиты в кибербезопасности, чтобы помочь организациям укрепить свои кодовые базы перед наступлением эпохи AI-атак. Эта модель очень дорогостоящая в эксплуатации и в ближайшее время не будет доступна широкой публике.
Утечка произошла из-за «человеческой ошибки» в внешнем инструменте CMS Anthropic, что привело к тому, что около 3000 неопубликованных активов (включая черновики блогов, изображения и PDF-файлы) были случайно размещены в незашищённой базе данных. Эти файлы обнаружили независимо исследователь по кибербезопасности из Кембриджского университета Alexandre Pauwels и старший специалист по AI-безопасности из LayerX Security Roy Paz. Среди утёкших данных — детали закрытой европейской конференции для CEO компаний, которая состоится в Великобритании, на которой примет участие CEO Dario Amodei. Мероприятие пройдет в английском загородном особняке XVIII века.
Представитель Anthropic заявил: «Мы разрабатываем универсальную модель, которая достигла значительных успехов в области логического мышления, программирования и кибербезопасности. Учитывая её мощность, мы будем очень осторожны с её выпуском».