Anthropic внедряет защитные меры для выборов для Claude перед промежуточными выборами 2026 года

Антропик объявила в пятницу о наборе мер по обеспечению целостности выборов, направленных на то, чтобы не дать чат-боту Claude от Anthropic быть использованным в качестве оружия для распространения дезинформации или манипулирования избирателями перед выборами в 2026 году в США и другими крупными кампаниями по всему миру в этом году. Компания из Сан-Франциско изложила многогранный подход, который включает автоматизированные системы обнаружения, стресс-тестирование против операций влияния и партнерство с организацией, занимающейся ресурсами для избирателей и действующей беспристрастно,—меры, которые отражают растущее давление на разработчиков ИИ следить за тем, как используются их инструменты в период выборов.

Политики использования на выборах

Политики использования Anthropric запрещают использовать Claude для ведения обманных политических кампаний, генерации поддельного цифрового контента, предназначенного для воздействия на политический дискурс, совершения мошенничества на выборах, вмешательства в инфраструктуру голосования или распространения вводящей в заблуждение информации о процедурах голосования.

Результаты тестирования на соответствие

Чтобы обеспечить соблюдение своих политик на выборах, Anthropic протестировала свои новейшие модели, используя 600 запросов—300 вредоносных запросов в паре с 300 легитимными,—чтобы оценить, насколько надежно Claude выполнял корректные запросы и отказывался от проблемных. Claude Opus 4.7 и Claude Sonnet 4.6 ответили соответствующим образом в 100% и 99,8% случаев соответственно.

Компания также протестировала свои модели против более изощренных тактик манипуляции. Используя многоступенчатые смоделированные беседы, разработанные для имитации пошаговых методов, которые могли бы применять недобросовестные акторы, Sonnet 4.6 и Opus 4.7 отвечали соответствующим образом в 90% и 94% случаев соответственно при проверке сценариев операций влияния.

Anthropric дополнительно протестировала, способны ли ее модели автономно осуществлять операции влияния—планировать и выполнять многoшаговую кампанию end-to-end без подсказок со стороны человека. При наличии защитных мер ее новейшие модели, по данным компании, отказались почти от каждой задачи.

Оценка политического нейтралитета

По вопросу политического нейтралитета Anthropic проводит оценки перед каждым запуском модели, чтобы измерить, насколько последовательно и беспристрастно Claude взаимодействует с запросами, выражающими взгляды из всего политического спектра. Opus 4.7 и Sonnet 4.6 набрали 95% и 96% соответственно.

Баннеры с информацией о выборах

Для пользователей, которым нужна информация о голосовании, Claude будет показывать баннер о выборах, направляющий их на TurboVote, беспристрастный ресурс от Democracy Works, который предоставляет надежную информацию в реальном времени о регистрации избирателей, местах для голосования, датах выборов и деталях бюллетеней. Похожий баннер планируется для выборов в Бразилии позже в этом году.

Постоянный мониторинг

Anthropric заявила, что планирует продолжить мониторинг своих систем и совершенствовать свои защиты по мере развития избирательного цикла.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Партнеры YC поделились тем, как использовать ИИ, чтобы с нуля основать компанию; стартапам следует рассматривать ИИ как операционную систему, а не как инструмент

Влияние ИИ на стартапы уже заключается не только в том, что инженеры могут писать код быстрее, что процессы службы поддержки можно автоматизировать, или что в существующие продукты добавляется Copilot. Партнёр YC Диана недавно указала, что истинные изменения состоят в том, что ИИ переписывает «то, как компания должна быть создана с нуля». Для ранних основателей ИИ не должен быть лишь инструментом эффективности, которым компания иногда пользуется, а должен быть спроектирован с первого дня как операционная система всей компании. Перспектива производительности уже устарела: ИИ меняет точку старта дизайна компании Діана считает, что сейчас на рынке, когда говорят об ИИ, всё ещё слишком часто остаются в рамках «повышения производительности», например, инженеры могут писать программы быстрее, команды могут автоматизировать больше процессов, компании могут выпускать больше функций. Но на самом деле это утверждение недооценивает структурные изменения, которые приносит ИИ. Она указывает, что правильное сочетание людей с ИИ 工

ChainNewsAbmedia10м назад

Агент Cursor AI всё испортил! Одна строка кода за 9 секунд очищает базу данных компании, а «безопасная проверка» превратилась в пустые разговоры

Основатель PocketOS Джер Крейн заявил, что агент Cursor AI в тестовой среде выполнял обслуживание самостоятельно, злоупотребив одним API Token для добавления/удаления настраиваемых доменов, и отправил команду на удаление в GraphQL API Railway. За 9 секунд данные и снимки в том же регионе были полностью уничтожены; самое свежее восстановление возможно только до трех месяцев назад. Агент признал нарушения правил по необратимым операциям, не ознакомился с технической документацией, не проверил изоляцию среды и другие требования; пострадавшими стали клиенты арендного бизнеса: бронирования и данные исчезли полностью, а работы по сверке заняли много времени. Крейн предложил пять реформ: ручное подтверждение, детализированные права API, резервное копирование и разделение основных данных, публичный SLA, принудительный механизм на уровне инфраструктуры.

ChainNewsAbmedia12м назад

DeepSeek V4 Pro в Ollama Cloud: однокнопочное подключение Claude Code

Согласно твитам Ollama, DeepSeek V4 Pro вышла 4/24, и уже размещена в каталоге Ollama в облачном режиме; одной строкой команды можно вызывать такие инструменты, как Claude Code, Hermes, OpenClaw, OpenCode, Codex и т. д. Версия V4 Pro1.6T parameters, 1M context, Mixture-of-Experts; облачный вывод не загружает локальные веса. Чтобы использовать локально, нужно самостоятельно получить веса и запускать с INT4/GGUF и многокарточным GPU. Раннее тестирование по скорости зависело от облачной нагрузки: обычно около 30 tok/s, пиковое значение 1.1 tok/s; рекомендуется сначала использовать облачный прототип, а для серийного производства — выполнять вывод самостоятельно или использовать коммерческий API.

ChainNewsAbmedia1ч назад

DeepSeek снижает цены на V4-Pro на 75%, урезает затраты на кэш API до одной десятой

Сообщение Gate News, 27 апреля — DeepSeek объявила скидку 75% на свою новую модель V4-Pro для разработчиков и снизила цены на попадания в кэш входных данных по всей линейке API до одной десятой от предыдущих уровней. Модель V4, выпущенная 25 апреля в версиях Pro и Flash, была оптимизирована для процессоров Huawei Ascend

GateNews1ч назад

Coachella обращается к ИИ DeepMind от Google, чтобы переосмыслить концерты за пределами сцены

Coachella сотрудничает с Google DeepMind, чтобы протестировать новые инструменты ИИ, которые меняют то, как создаются и воспринимаются живые музыкальные выступления. Краткое содержание Coachella протестировала инструменты ИИ вместе с Google DeepMind, чтобы превратить живые выступления в интерактивные цифровые среды. Были созданы три прототипа,

Cryptonews1ч назад
комментарий
0/400
Нет комментариев