Avec l’évolution rapide des applications des agents IA, les développeurs passent du « Prompt Engineering » à une conception de systèmes plus structurée. Le dernier guide publié par Google Cloud Tech propose cinq grands modèles de conception pour établir un cadre de développement plus fiable et réutilisable pour les compétences des agents IA (Agent Skills).
Ce partage, rédigé par Shubham Saboo et Lavi Nigam, indique qu’avec SKILL.md devenu la norme adoptée par plus de 30 outils, l’attention des développeurs s’est déplacée de « comment empaqueter » à « comment concevoir la logique interne », marquant ainsi l’entrée officielle de l’IA dans une nouvelle phase d’ingénierie.
SKILL.md devient la norme, l’IA Agent Skills vers la modularité
Le concept d’Agent Skills a été initialement proposé par Anthropic et est aujourd’hui devenu une norme open source. Son principe central repose sur une structure modulaire de dossiers et un fichier SKILL.md, permettant à l’IA de charger ses capacités selon les besoins.
Le fichier SKILL.md ne contient pas seulement des instructions et des métadonnées, mais peut aussi référencer des ressources externes, permettant à l’agent d’adopter une « révélation progressive » lors de l’exécution des tâches, évitant ainsi une surcharge de contexte et améliorant l’efficacité et la précision.
Actuellement, plus de 30 outils, tels que Claude Code, Gemini CLI, Cursor, ont adopté cette norme, ce qui montre qu’elle devient rapidement la base de développement des agents IA.
Du Prompt Hack aux modèles de conception : analyse des cinq architectures clés
Google Cloud Tech souligne que de nombreux développeurs se concentrent encore excessivement sur la structure YAML et la conception des répertoires, mais que le véritable enjeu réside dans la « logique interne des compétences ». Pour cela, l’équipe propose cinq modèles de conception réutilisables pour aider à créer des systèmes IA stables et prévisibles.
Tool Wrapper : faire de l’IA un expert instantanément
Le Tool Wrapper est le modèle le plus basique, consistant à encapsuler un outil ou un framework spécifique en une compétence, permettant à l’IA d’accéder rapidement à des connaissances spécialisées lorsque nécessaire.
Par exemple, lors du développement avec FastAPI, on peut placer la spécification API et les meilleures pratiques dans le répertoire references/ ; elles ne seront chargées que lorsque la tâche concernée est déclenchée, évitant ainsi une surcharge du prompt principal.
Generator : moteur clé pour standardiser les sorties
Le modèle Generator est adapté aux scénarios nécessitant des sorties cohérentes, comme la documentation API, les messages de commit automatiques ou la génération de modèles de projets.
Son principe consiste à placer les modèles dans assets/ et à utiliser les guides de style dans references/, le tout étant rempli par la compétence. Cette approche permet d’obtenir des sorties à la fois standardisées et flexibles.
Reviewer : établir un mécanisme de vérification quantifiable
Le modèle Reviewer sépare « les standards de vérification » de « la logique d’exécution ». Les développeurs peuvent créer une liste de contrôle dans references/, par exemple pour la qualité du code ou la conformité aux normes de sécurité.
L’IA évaluera selon ces standards et produira un résultat structuré. En remplaçant ces standards par les règles de sécurité OWASP, on peut rapidement transformer cet outil en un vérificateur de vulnérabilités, particulièrement utile pour l’automatisation des revues de PR.
Inversion : passer de répondant à questionneur
Le modèle Inversion bouleverse le processus traditionnel où l’IA génère directement une réponse, en forçant l’agent à poser d’abord des questions structurées.
Grâce à une restriction du type « ne pas continuer avant d’avoir terminé », l’IA doit recueillir progressivement toutes les exigences, ce qui est particulièrement adapté aux scénarios de planification de projets ou autres contextes nécessitant une compréhension approfondie, évitant ainsi des erreurs dues à un manque d’informations.
Pipeline : centre de contrôle pour tâches complexes
Le modèle Pipeline est conçu pour des tâches en plusieurs étapes, imposant un ordre d’exécution et des points de contrôle, avec la possibilité d’intégrer une confirmation par l’utilisateur.
Par exemple, dans un processus de génération de documents, il faut d’abord valider le docstring, puis passer à l’assemblage final. Ce modèle garantit que chaque étape est conforme, évitant des erreurs dues à des sauts d’étapes.
Composition modulaire : avancée dans la conception des compétences IA
Ces cinq modèles ne sont pas indépendants, mais peuvent être combinés de manière flexible. Par exemple :
Le Google Agent Development Kit (ADK) supporte nativement cette approche, en utilisant SkillToolset pour charger uniquement les modules nécessaires lors de l’exécution, optimisant ainsi l’utilisation des tokens.
De plus, un arbre de décision est fourni pour aider les développeurs à choisir le modèle adapté à leur scénario, réduisant considérablement la barrière à la conception.
L’IA dans l’ère de l’ingénierie : la fiabilité devient essentielle
Google Cloud Tech insiste : « Ne tentez plus d’insérer des instructions complexes et fragiles dans un seul system prompt. »
Cette déclaration souligne un changement majeur dans le développement de l’IA — passant d’une phase d’expérimentation basée sur des hacks de prompts à une approche d’ingénierie structurée et principielle, semblable à l’évolution des modèles de conception dans l’ingénierie logicielle.
Les réactions sur la plateforme X sont également très positives, de nombreux développeurs qualifiant cela de « point de départ pour la conception de systèmes IA » et affirmant que ces modèles peuvent efficacement éviter que les agents ne deviennent des « spaghetti » difficiles à maintenir.
Actuellement, la norme Agent Skills est entièrement open source, et le Google ADK fournit une documentation complète et des exemples (google.github.io/adk-docs), permettant aux développeurs de se lancer rapidement.
Cet article, publié initialement par ABMedia sur Chain News, présente les cinq grands modèles de conception de Google Cloud pour créer des compétences d’agent IA hautement fiables, marquant la fin de l’ère du Prompt Hack.