Данные Anthropic: почти половина вызовов AI-агента сосредоточена в области программной инженерии, и эти 16 сегментов остаются голубым океаном

Медицина занимает 1 %, право — 0,9 %, образование — 1,8 %. Это не насыщенные рынки, а рынки, практически ещё не существующие.

Автор: Garry’s List

Перевод: Deep潮 TechFlow

Обзор Deep潮: Anthropic недавно опубликовала самое всестороннее исследование реального использования AI-агентов на сегодняшний день. Основные данные: около 50 % вызовов инструментов агентами связаны с программной инженерией, а медицина, право, образование и ещё 16 вертикальных областей вместе взятых — менее половины оставшихся вызовов, каждая область занимает менее 5 %.

Это не сигнал насыщенности рынка, а карта 300 вертикальных AI-единорогов — более ценное открытие, цитируемое в статье: модели уже могут работать почти 5 часов самостоятельно, но пользователи фактически позволяют им работать всего 42 минуты. Этот «дефицит доверия» сам по себе является следующей возможностью для продукта.

Полный текст:

Программная инженерия занимает почти 50 % всех вызовов инструментов AI-агентов. Медицина, право, финансы и ещё 16 вертикальных областей практически не затронуты, каждая менее 5 %. Это означает, что ждут создания 300 вертикальных AI-единорогов.

Если бы я сегодня начинал бизнес, я бы сосредоточился на красной области этого графика, пока не увидел своё будущее.

Основатель Box Аарон Леви заявил:

Этот график отлично показывает, насколько велики возможности в области AI-агентов сейчас.

Горизонтально, конечно, есть множество возможностей для агентов, но также много рабочих процессов, требующих глубоких знаний в конкретных областях, чтобы действительно помочь пользователям автоматизировать уникальные процессы в своей вертикали.

Шаблон таков: создание агентского программного обеспечения, подключенного к собственным данным, для эффективного взаимодействия пользователя и агента при обработке рабочих процессов, обладающего глубокими знаниями в конкретной области и способного управлять изменениями со стороны клиента.

На сегодняшний день в многих областях всё ещё есть огромные пробелы.

Программная инженерия занимает половину всех активностей AI-агентов. Остальная половина разбросана по 16 вертикалям, ни одна из которых не превышает 9 %. Медицина — 1 %, право — 0,9 %, образование — 1,8 %. Это не насыщенные рынки, а рынки, практически ещё не существующие.

Anthropic только что опубликовала самое всестороннее исследование реального использования AI-агентов. Основной вывод: программная инженерия занимает 49,7 % вызовов API этих агентов. В скрытой части — главный вывод: всё остальное — это голубой океан.

Задержки в развертывании

Есть данные, которые должны вдохновить предпринимателей: возможности моделей уже значительно превосходят границы доверия пользователей.

Оценка возможностей METR показывает, что Claude может решать задачи, на выполнение которых у человека уходит почти пять часов. Но в реальных условиях средняя продолжительность сессии — около 42 минут, даже в 99,9-м процентиле. Этот разрыв — между тем, что AI может делать, и тем, что мы ему разрешаем — представляет огромную возможность.

График: Максимальная продолжительность обучения Claude Code за три месяца почти удвоилась. Это не только повысило его возможности, но и укрепило доверие.

Источник: x.com

С октября 2025 по январь 2026 года продолжительность одной сессии в 99,9-м процентиле почти удвоилась — с менее 25 минут до более 45 минут. Рост был стабильным на всех версиях модели. Это не только улучшение модели, но и постепенное обучение пользователей, расширяющее их доверие к агенту.

«С августа по декабрь успехи Claude Code в самых сложных задачах внутри компании удвоились, а количество ручных вмешательств в каждую сессию снизилось с 5,4 до 3,3 раза.»

Возможности уже есть, развертывание — ещё нет. Это не проблема, а продуктовая возможность.

Как развивается доверие

20 % новых пользователей автоматически одобряют действия Claude Code. К 750-й сессии более 40 % сессий проходят полностью в автоматическом режиме. Но есть удивительный факт: опытные пользователи чаще вмешиваются, а не реже. Новички вмешиваются в 5 % случаев, а опытные — в 9 %.

График: Доверие — это навык, который постоянно накапливается. Новые пользователи автоматически одобряют 20 % сессий. К 750-й сессии эта доля превысит 40 %.

Изображение: Anthropic

Источник: x.com

Это не противоречит, а отражает изменение стратегии контроля. Новички постепенно одобряют операции заранее, опытные пользователи сначала дают разрешение, а при возникновении проблем вмешиваются — они перешли от предварительного одобрения к активному мониторингу.

На уровне безопасности важное открытие: при выполнении сложных задач Claude Code активнее запрашивает уточнения, чем человек — в два раза чаще. Агент приостанавливает выполнение, чтобы уточнить, а не просто идёт напролом. Это особенность, а не недостаток.

«Главный вывод этого исследования: автономия, которую реализуют агенты на практике, формируется совместно моделью, пользователем и продуктом. Claude при неопределённости приостанавливает вопросы, чтобы ограничить свою самостоятельность. Пользователи, взаимодействуя с моделью, формируют доверие и соответственно корректируют свою стратегию контроля.»

Стратегия вертикальных AI Леви

Аарон Леви выделил огромные богатства и ценность, которые ещё предстоит раскрыть: создание агентского ПО, подключенного к собственным данным, чтобы реально решать реальные задачи людей, заполнять контекст максимально полно для повышения интеллектуальной отдачи, а также — что большинство предпринимателей игнорируют — управлять изменениями со стороны клиента.

Именно это делает вертикальный AI настолько трудно копируемым. Любой может создать API-обертку, но очень мало кто умеет управлять уникальными рабочими процессами, нормативными требованиями и организационным сопротивлением в медицине, праве или строительстве.

SaaS за последние десятилетия вырос в десять раз каждые 10 лет. За последние 20 лет более 40 % венчурных инвестиций пошли в SaaS-компании. В отрасли появилось более 170 SaaS-единорогов. Логика проста: у каждого из них есть вертикальный AI-версия, которая ждёт своего часа. А AI-версия может вырасти в десятки раз, потому что она заменяет не только софт, но и оператора.

Суть совместного построения

Ключевые открытия Anthropic заслуживают серьёзного внимания всех, кто участвует в формировании AI-политики. Автономия — это не свойство модели по умолчанию, а результат совместной работы модели, пользователя и продукта. Перед развертыванием это понять невозможно — нужно оценивать в реальных условиях.

Официальное заявление Anthropic:

Программная инженерия составляет около 50 % вызовов API наших агентов, но мы также видим появление новых отраслей. По мере расширения границ автономии и ответственности, мониторинг после развертывания становится критически важным. Мы призываем других разработчиков моделей расширять это исследование.

Цифры по безопасности внушают доверие: 73 % вызовов инструментов проходят с участием человека, только 0,8 % операций — необратимы. Самые рискованные сценарии — утечка API-ключей или автономные крипто-транзакции — в основном связаны с оценкой безопасности, а не реальным производством.

«Регуляции, требующие конкретных режимов взаимодействия — например, одобрение каждым человеком — создают препятствия, но не повышают безопасность.»

Обязательное требование «одобрения каждого действия» убьёт продуктивность, не увеличивая безопасность. Лучше обеспечить возможность мониторинга и вмешательства человека, а не прописывать конкретные рабочие процессы одобрения.

Где скрыты единороги

Карта уже нарисована. Программная инженерия уже есть. Медицина, право, финансы, образование, обслуживание клиентов, логистика — 16 вертикалей, каждая с долей рынка в единицах процентов — ждут тех, кто действительно внедрит профессиональные знания в агента.

Ранее было создано более 300 SaaS-единорогов, и скоро появятся ещё 300 вертикальных AI-единорогов. Те, кто выберет вертикаль, встроит профессиональные знания и поймёт, как управлять изменениями, — получат следующий десятилетний рынок корпоративного ПО.

Модель уже способна работать пять часов, а пользователь — всего 42 минуты. Это сигнал: мы всё ещё на очень ранней стадии, и есть масса возможностей для построения, особенно там, где даже минуту не использовали интеллектуальные возможности.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить