Dados da Anthropic: Quase metade das chamadas de AI Agent concentram-se em engenharia de software, estes 16 setores continuam a ser um mercado inexplorado

2026-02-24 07:51:32

Medicina representa 1%, direito 0,9%, educação 1,8%. Estes não são mercados saturados, mas mercados quase inexistentes.

Autor: Garry’s List

Tradução: Deep潮 TechFlow

Deep潮 Guia de Leitura: A Anthropic lançou recentemente o estudo mais completo até hoje sobre o uso real de Agentes de IA, com dados centrais: engenharia de software responde por quase 50% das chamadas de ferramentas de agentes, enquanto medicina, direito, educação e outros 16 setores verticais juntos representam menos da metade do restante, com cada setor abaixo de 5%.

Isso não é um sinal de mercado saturado, mas um mapa de 300 unicórnios de IA vertical — e ainda mais valioso é uma descoberta contraintuitiva citada no artigo: o modelo já consegue trabalhar quase 5 horas de forma independente, mas os usuários só o deixam trabalhar 42 minutos, esse “déficit de confiança” é, na verdade, uma oportunidade de produto.

O texto completo:

Engenharia de software responde por quase 50% de todas as chamadas de ferramentas de agentes de IA. Os 16 setores verticais, como medicina, direito e finanças, quase não foram explorados, cada um com menos de 5%. Isso significa que há 300 unicórnios de IA vertical esperando para serem construídos.

Se eu fosse empreender hoje, focaria na área vermelha daquele gráfico de barras até ver meu próprio futuro.

Aaron Levie, fundador da Box, afirma:

Este gráfico nos lembra bem o quão grande é a oportunidade na área de Agentes de IA.

Claro que há muitas oportunidades horizontais, mas também há muitos fluxos de trabalho que requerem profundo conhecimento de domínio para realmente ajudar os usuários a automatizar processos únicos de seus setores.

O modelo de template é: construir software de Agentes que acessem dados proprietários, de modo a conectar efetivamente o usuário ao agente para colaborar em fluxos de trabalho, com capacidade de engenharia de contexto especializada por domínio e de promover mudanças na gestão do cliente.

Atualmente, muitos setores ainda apresentam lacunas enormes.

Engenharia de software domina metade de toda atividade de Agentes de IA. A outra metade está dispersa em 16 setores verticais, nenhum ultrapassando 9%. Medicina representa 1%, direito 0,9%, educação 1,8%. Estes não são mercados saturados, mas mercados quase inexistentes.

A Anthropic lançou recentemente o estudo mais completo até hoje sobre o uso real de Agentes de IA. A descoberta central é: engenharia de software responde por 49,7% das chamadas de ferramentas de API de seus Agentes. A conclusão subjacente é: tudo o mais é oceano azul.

Atraso na implementação

Há um dado que deve empolgar os empreendedores: a capacidade do modelo já ultrapassou bastante os limites de confiança que os usuários estão dispostos a dar.

A avaliação de capacidades do METR mostra que Claude consegue resolver tarefas que levariam quase cinco horas para serem concluídas por humanos. Mas, na prática, a duração média de uma sessão no 99,9º percentil é de apenas cerca de 42 minutos. Essa diferença — entre o que a IA pode fazer e o que permitimos que ela faça — é uma oportunidade enorme.

Imagem: O tempo máximo de treinamento do Claude Code quase dobrou em três meses. Isso não só aumentou a capacidade, mas também fortaleceu a confiança.

Fonte: x.com

De outubro de 2025 a janeiro de 2026, a duração de uma única sessão no 99,9º percentil quase dobrou, passando de menos de 25 minutos para mais de 45 minutos. O crescimento foi consistente entre diferentes versões do modelo. Não é apenas que o modelo ficou mais forte, mas que os usuários, ao usar repetidamente, aprenderam a confiar nele, estendendo gradualmente essa confiança.

“De agosto a dezembro, a taxa de sucesso do Claude Code em tarefas desafiadoras para usuários internos dobrou, enquanto o número de intervenções humanas por sessão caiu de 5,4 para 3,3.”

A capacidade já está lá, a implementação ainda não acompanhou. Isso não é um problema, mas uma oportunidade de produto.

Como a confiança evolui

20% dos novos usuários aprovam automaticamente as ações do Claude Code. Quando chegam a 750 sessões, mais de 40% das sessões funcionam totalmente em modo de aprovação automática. Mas uma descoberta contraintuitiva: usuários experientes tendem a intervir mais, não menos. Usuários novos intervêm em 5% das rodadas, usuários antigos em 9%.

Imagem: A confiança é uma habilidade que se acumula continuamente. Novos usuários aprovam automaticamente 20% das sessões. Quando chegam a 750 sessões, essa proporção ultrapassa 40%.

Fonte: Anthropic

Isso não é uma contradição, mas uma mudança na estratégia de supervisão. Iniciantes aprovam gradualmente antes de agir, usuários experientes autorizam primeiro e intervêm só quando há problemas — eles já migraram de aprovações prévias para monitoramento ativo.

Uma descoberta importante na camada de segurança: em tarefas complexas, Claude Code solicita esclarecimentos mais de duas vezes mais frequentemente do que a intervenção humana ativa. O agente pausa para confirmação, ao invés de seguir adiante sem questionar. Isso é uma característica, não um defeito.

“A principal lição deste estudo é que a autonomia exercida pelos agentes na prática é construída conjuntamente pelo modelo, pelo usuário e pelo produto. Quando incerto, o Claude pausa para perguntar, limitando sua independência. Os usuários, ao colaborar com o modelo, constroem confiança e ajustam suas estratégias de supervisão.”

A estratégia vertical de Levie

Aaron Levie apontou uma enorme riqueza e valor ainda por serem desbloqueados: construir software de Agentes que acessem dados proprietários, resolvam problemas reais de pessoas, preencham o contexto para maximizar a inteligência produzida, e — o que muitos empreendedores negligenciam — promovam mudanças na gestão do cliente.

Esse último ponto é exatamente o motivo pelo qual IA vertical é tão difícil de ser copiada. Qualquer um pode montar uma API, mas poucos conseguem realmente dominar fluxos de trabalho, regulações e resistências específicas de setores como saúde, direito ou construção.

SaaS cresceu dez vezes a cada década nas últimas décadas. Nos últimos 20 anos, mais de 40% do capital de risco foi para empresas SaaS. O setor gerou mais de 170 unicórnios SaaS. A lógica é simples: cada um desses unicórnios tem uma versão de IA vertical esperando para surgir. E essa versão de IA pode crescer ainda mais — porque ela substitui não só software, mas também operadores.

A essência da construção conjunta

A descoberta central da Anthropic é importante para qualquer pessoa envolvida na formulação de políticas de IA. Autonomia não é uma propriedade inerente ao modelo, mas uma construção conjunta do modelo, do usuário e do produto. Avaliações pré-implantação não capturam isso; é preciso avaliar na prática, em uso real.

A Anthropic afirma:

Engenharia de software responde por cerca de 50% das chamadas de ferramentas de agentes na nossa API, mas também vemos surgirem outros setores. À medida que os limites de autonomia e risco se expandem, o monitoramento pós-implantação torna-se crucial. Incentivamos outros desenvolvedores a expandir essa pesquisa.

Dados de segurança tranquilizam: 73% das chamadas de ferramentas envolvem intervenção humana, e apenas 0,8% das operações são irreversíveis. Os cenários de maior risco — como vazamento de chaves de API ou negociações autônomas criptografadas — geralmente envolvem avaliações de segurança, não ambientes de produção reais.

“Regulamentações que obrigam a seguir modos específicos de interação — como exigir aprovação humana para cada operação — só criam atritos, sem necessariamente aumentar a segurança.”

Impor a política de “aprovar cada operação” mata produtividade, sem aumentar a segurança. O objetivo melhor é garantir que o humano possa monitorar e intervir quando necessário, sem prescrever workflows específicos de aprovação.

Onde estão os unicórnios

O mapa já está traçado. Engenharia de software já está sendo feita. Medicina, direito, finanças, educação, atendimento ao cliente, logística — 16 setores verticais, cada um com participação de mercado de um dígito — aguardam alguém que realmente incorpore conhecimento especializado ao agente.

Já surgiram mais de 300 unicórnios SaaS, e os próximos 300 de IA vertical estão por vir. Fundadores que escolhem setores, embutem conhecimento especializado e pensam em como conduzir mudanças terão o próximo grande mercado de software empresarial na próxima década.

O modelo já consegue trabalhar por cinco horas, mas os usuários só deixam ele trabalhar por 42 minutos. Esse é o sinal: ainda estamos na fase inicial, há muito a construir, e há inúmeros setores onde nem mesmo um minuto de inteligência foi explorado.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.