Дослідження Anthropic виявили, що користувачі повторюють ітерації з AI, але під час програмування рідко ставлять під сумнів результати виводу

robot
Генерація анотацій у процесі

Investing.com - Дослідження, опубліковане Anthropic у понеділок, показало, що користувачі, які багаторазово взаємодіють із помічником Claude AI, демонструють навички, що перевищують у два рази тих, хто приймає початкову відповідь, але коли цей інструмент генерує код або документи, критичність користувачів зменшується.

Ця компанія з штучного інтелекту використала свою рамку 4D AI для аналізу 9830 анонімних діалогів на платформі Claude.ai за сім днів у січні 2026 року. Рамка відстежує 11 видимих поведінкових ознак, включаючи ітерацію, перевірку фактів і сумніви у логіці. Дослідження показало, що 85,7% діалогів демонструють ітеративну та вдоскональну поведінку, при цьому в середньому вони містять 2,67 додаткових навичок, тоді як у діалогах без ітерації — лише 1,33.

Діалоги, що містять продукти, такі як код, документи або інтерактивні інструменти, становили 12,3% вибірки і демонстрували вищий рівень командної поведінки. У таких обмінах користувачі частіше чітко визначають цілі, вказують формат і надають приклади, що збільшило відповідно на 14,7, 14,5 і 13,4 відсоткових пунктів.

Також у цих діалогах із створеними продуктами спостерігається нижчий рівень критичної оцінки. У порівнянні з діалогами без продуктів, ймовірність того, що користувачі виявлять відсутність контексту, знизилася на 5,2 відсоткових пунктів, ймовірність перевірки фактів — на 3,7, а ймовірність сумнівів у логіці Claude — на 3,1.

Anthropic заявила, що це дослідження створює базову лінію для відстеження розвитку навичок штучного інтелекту з часом. Компанія планує провести аналіз когорти, порівнюючи нових і досвідчених користувачів, а також використовувати якісні методи для оцінки поведінки за межами чат-інтерфейсу.

Цей текст був перекладений за допомогою штучного інтелекту. Детальніше дивіться у нашій угоді користувача.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити