Données d'Anthropic : près de la moitié des appels à l'AI Agent se concentrent sur l'ingénierie logicielle, ces 16 domaines restent une mer bleue

La médecine représente 1 %, le droit 0,9 %, l’éducation 1,8 %. Ce ne sont pas des marchés saturés, mais des marchés presque inexistants.

Auteur : Garry’s List

Traduction : Deep潮 TechFlow

Lecture approfondie de Deep潮 : Anthropic a publié la recherche la plus complète à ce jour sur l’utilisation réelle des agents IA, avec comme donnée clé : l’ingénierie logicielle représente près de 50 % des appels d’outils d’agents, tandis que la médecine, le droit, l’éducation et 13 autres secteurs verticaux combinés représentent moins de la moitié du reste, avec une part inférieure à 5 % dans chaque domaine.

Ce n’est pas un signe de saturation du marché, mais une carte de 300 licornes IA verticales — et ce qui est encore plus précieux, c’est une découverte contre-intuitive citée dans l’article : le modèle peut fonctionner de manière autonome près de 5 heures, mais les utilisateurs ne le font travailler que 42 minutes en réalité, ce qui constitue un « déficit de confiance » en soi-même, une opportunité de produit à venir.

Voici le texte intégral :

L’ingénierie logicielle représente près de 50 % de tous les appels d’outils d’agents IA. Les 16 autres secteurs verticaux — médecine, droit, finance, etc. — sont presque vierges, chacun représentant moins de 5 %. Cela signifie qu’il y a 300 licornes IA verticales en attente d’être créées.

Si je devais lancer une startup aujourd’hui, je me concentrerais sur la zone rouge de ce graphique en barres, jusqu’à ce que j’y voie mon avenir.

Aaron Levie, fondateur de Box, déclare :

Ce graphique nous rappelle à quel point le domaine des agents IA offre de grandes opportunités.

Il y aura bien sûr beaucoup d’opportunités horizontales pour les agents, mais aussi de nombreux flux de travail nécessitant une expertise approfondie dans un domaine spécifique pour vraiment aider les utilisateurs à automatiser leurs processus uniques dans leur secteur vertical.

Le modèle est : construire un logiciel agent connecté à des données propriétaires, pour gérer efficacement les flux de travail en facilitant la collaboration entre l’utilisateur et l’agent, tout en disposant d’une capacité d’ingénierie contextuelle spécialisée dans le domaine, et en étant capable de gérer le changement côté client.

De nombreux domaines présentent encore d’énormes lacunes.

L’ingénierie logicielle occupe près de la moitié de toutes les activités des agents IA. L’autre moitié est dispersée dans 16 secteurs verticaux, aucun ne dépassant 9 %. La médecine représente 1 %, le droit 0,9 %, l’éducation 1,8 %. Ce ne sont pas des marchés saturés, mais des marchés presque inexistants.

Anthropic a récemment publié la recherche la plus complète à ce jour sur l’utilisation réelle des agents IA. La conclusion principale est : l’ingénierie logicielle représente 49,7 % des appels d’outils d’agents via leur API. La conclusion clé sous-jacente est : tout le reste est une mer bleue.

Retard dans le déploiement

Une donnée devrait enthousiasmer les entrepreneurs : la capacité du modèle dépasse largement la confiance que les utilisateurs lui accordent.

L’évaluation des capacités de METR montre que Claude peut résoudre des tâches qui prendraient près de cinq heures à un humain. Mais en pratique, la durée de session au 99,9e percentile n’est que d’environ 42 minutes. Cet écart — entre ce que l’IA peut faire et ce que nous lui permettons de faire — représente une énorme opportunité.

Graphique : La durée maximale d’entraînement de Claude Code en trois mois a presque doublé. Cela a non seulement amélioré ses capacités, mais aussi renforcé la confiance.

Source : x.com

De octobre 2025 à janvier 2026, la durée de session unique au 99,9e percentile a presque doublé, passant de moins de 25 minutes à plus de 45 minutes. La croissance est régulière entre différentes versions du modèle. Ce n’est pas seulement que le modèle devient plus puissant, mais que les utilisateurs apprennent à l’utiliser, étendant progressivement leur confiance dans l’agent.

“De août à décembre, le taux de réussite de Claude Code sur les tâches les plus difficiles pour les utilisateurs internes a doublé, tandis que le nombre d’interventions humaines par session est passé de 5,4 à 3,3.”

Les capacités sont là, le déploiement ne suit pas encore. Ce n’est pas un problème, mais une opportunité produit.

Comment l’évolution de la confiance se produit

20 % des nouveaux utilisateurs approuvent automatiquement les opérations de Claude Code. À 750 sessions, plus de 40 % des sessions se déroulent entièrement en mode automatique. Mais une découverte contre-intuitive : les utilisateurs expérimentés interviennent en réalité plus souvent, pas moins. Les nouveaux utilisateurs interviennent dans 5 % des tours, les utilisateurs expérimentés dans 9 %.

Graphique : La confiance est une compétence qui se construit continuellement. 20 % des nouveaux utilisateurs approuvent automatiquement 20 % des sessions. À 750 sessions, cette proportion dépasse 40 %.

Source : Anthropic

Ce n’est pas contradictoire, mais une évolution dans la stratégie de supervision. Les débutants approuvent progressivement avant que l’opération ne se produise, tandis que les utilisateurs expérimentés donnent d’abord leur autorisation, puis interviennent en cas de problème — ils sont passés d’une approbation préalable à une surveillance proactive.

Une autre découverte importante pour la sécurité : sur des tâches complexes, Claude Code demande des clarifications plus de deux fois plus souvent que l’intervention humaine proactive. L’agent suspend la confirmation plutôt que de foncer jusqu’au bout. C’est une caractéristique, pas un défaut.

“Le principal enseignement de cette étude est que l’autonomie exercée par l’agent en pratique est co-construite par le modèle, l’utilisateur et le produit. Quand il n’est pas certain, Claude suspend la question pour limiter son autonomie. L’utilisateur construit la confiance en collaborant avec le modèle et ajuste sa supervision en conséquence.”

La stratégie verticale d’Aaron Levie

Aaron Levie a souligné la richesse et la valeur énormes encore à libérer : construire un logiciel agent connecté à des données propriétaires, qui résout réellement des problèmes humains concrets, en remplissant le contexte pour maximiser la sortie intelligente, et — ce que la plupart des entrepreneurs négligent — en favorisant la gestion du changement côté client.

Ce dernier point est précisément la raison pour laquelle l’IA verticale est si difficile à copier. N’importe qui peut créer une API encapsulée, mais peu savent vraiment maîtriser les flux de travail, la réglementation et la résistance organisationnelle spécifiques à la facturation médicale, à la découverte juridique ou à l’approbation des permis de construire.

Le SaaS a connu une croissance de dix fois tous les dix ans au cours des dernières décennies. Plus de 40 % des investissements en capital-risque ont été dirigés vers des entreprises SaaS au cours des 20 dernières années. Plus de 170 licornes SaaS ont été créées. La logique est simple : chacune de ces licornes a une version verticale IA en attente. Et cette version IA pourrait être dix fois plus grande, car elle remplace non seulement le logiciel, mais aussi les opérateurs.

L’essence de la co-construction

Les découvertes clés d’Anthropic méritent l’attention de tous ceux impliqués dans la politique IA. L’autonomie n’est pas une propriété inhérente au modèle, mais une construction conjointe entre le modèle, l’utilisateur et le produit. L’évaluation avant déploiement ne peut pas saisir cela ; il faut l’observer dans l’usage réel.

Anthropic déclare officiellement :

L’ingénierie logicielle représente environ 50 % des appels d’outils d’agents via notre API, mais nous voyons aussi émerger d’autres secteurs. À mesure que les limites de la responsabilité et de l’autonomie s’étendent, la surveillance après déploiement devient cruciale. Nous encourageons d’autres développeurs de modèles à étendre cette recherche.

Les chiffres rassurants en matière de sécurité : 73 % des appels d’outils impliquent une intervention humaine, seulement 0,8 % des opérations sont irréversibles. Les scénarios à haut risque — comme la fuite de clés API ou les transactions cryptographiques autonomes — relèvent principalement d’évaluations de sécurité, pas de la production réelle.

“Les réglementations imposant des modes d’interaction spécifiques — par exemple, exiger l’approbation humaine pour chaque opération — ne font que créer des frictions, sans nécessairement améliorer la sécurité.”

Imposer une politique d’« approbation pour chaque opération » tue la productivité sans augmenter la sécurité. Un objectif meilleur est de garantir que l’humain peut surveiller et intervenir, plutôt que d’imposer un workflow d’approbation précis.

Où se cachent les licornes

La carte est tracée. L’ingénierie logicielle est déjà en place. La médecine, le droit, la finance, l’éducation, le service client, la logistique — 16 secteurs verticaux, chacun avec une part de marché à un chiffre — attendent que des experts du domaine intègrent véritablement leur savoir dans l’agent.

Les 300 SaaS licornes précédentes ont été créées, et les 300 prochaines licornes IA verticales sont sur le point d’émerger. Ceux qui choisissent leur secteur, intègrent leur expertise spécifique dans l’agent, et comprennent comment conduire le changement auront le marché des logiciels d’entreprise de la prochaine décennie.

Le modèle peut déjà fonctionner pendant cinq heures, mais les utilisateurs ne le font travailler que 42 minutes. C’est le signal : nous sommes encore à un stade très précoce, avec énormément à construire, dans d’innombrables domaines où l’on n’a même pas encore vu une minute d’intelligence appliquée.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)