Исследование Anthropic выявило, что пользователи взаимодействуют с ИИ через повторные итерации, но при программировании реже ставят под сомнение результаты вывода

robot
Генерация тезисов в процессе

Investing.com - Исследование, опубликованное Anthropic в понедельник, показало, что пользователи, которые многократно взаимодействуют с помощником Claude AI, демонстрируют более высокую компетентность, чем те, кто принимает первоначальный ответ, в более чем в два раза, однако при создании кода или документации критичность пользователей снижается.

Эта компания, занимающаяся искусственным интеллектом, использовала свою рамочную модель 4D AI proficiency для анализа 9830 анонимных диалогов на платформе Claude.ai за семь дней в январе 2026 года. Эта модель отслеживает 11 наблюдаемых поведений, включая итерации, проверку фактов и сомнения в логике. Исследование показало, что 85,7% диалогов демонстрируют поведение итерации и доработки, при этом такие взаимодействия в среднем показывают 2,67 дополнительных признака компетентности, тогда как в диалогах без итераций — всего 1,33.

Диалоги, связанные с созданием кода, документов или интерактивных инструментов, составляют 12,3% выборки и показывают более высокий уровень командных действий. В таких взаимодействиях пользователи чаще указывают цели, задают формат и предоставляют примеры, что увеличивает эти показатели на 14,7, 14,5 и 13,4 процентных пункта соответственно.

Аналогично, диалоги с созданием таких продуктов показывают меньшую критическую оценку. По сравнению с диалогами без продуктов, вероятность того, что пользователь обнаружит отсутствие контекстной информации, снизилась на 5,2 процентных пункта, вероятность проверки фактов — на 3,7 пункта, а вероятность сомнения в логике Claude — на 3,1 пункта.

Anthropic заявила, что это исследование создает базовую линию для отслеживания развития компетентности ИИ со временем. Компания планирует проводить когорный анализ, сравнивая новых и опытных пользователей, а также использовать качественные методы для оценки поведения за пределами интерфейса чата.

Этот текст переведен с помощью искусственного интеллекта. Для получения дополнительной информации смотрите наши условия использования.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить