Google révolutionne la gestion des agents IA avec Agent Executor, un runtime open source conçu pour optimiser leur déploiement à grande échelle. Alors que les entreprises passent de la phase de prototypage à celle de l’exploitation opérationnelle, ce nouvel outil répond aux défis critiques liés à la fiabilité et à la scalabilité des workflows d’agents IA.

Un runtime conçu pour les défis de production

Agent Executor se distingue par ses capacités spécifiques pour gérer des workflows longs et distribués. Ces workflows, souvent complexes, peuvent s’étendre sur plusieurs jours et impliquent des interactions avec divers systèmes, des pauses pour validation humaine ou des récupérations après interruptions. Le runtime offre plusieurs fonctionnalités clés : une exécution durable permettant la reprise après des pannes ou des approbations humaines, un sandboxing sécurisé pour isoler les composants des agents, et des contrôles de cohérence de session pour les workflows distribués. Une autre innovation notable est le « trajectory branching », qui permet aux développeurs de tester des chemins d’exécution alternatifs à partir de points de contrôle sauvegardés, sans perdre le contexte précédent.

Un pont entre différents modèles de déploiement

Agent Executor supporte également une variété de modèles de déploiement, y compris les solutions on-premises et les agents gérés par Google. Les utilisateurs peuvent ainsi combiner différents types d’agents : ceux développés par Google, comme les agents frontier, ceux créés et gérés par l’utilisateur, ou encore des agents personnalisés utilisant le protocole Agent2Agent (A2A).

Des retours positifs des experts

Les analystes soulignent l’importance de ces fonctionnalités pour les entreprises. Advait Patel, senior reliability engineer chez Broadcom, met en avant la nécessité de durabilité et de résilience pour les agents en production. « Les frameworks existants comme LangChain et AutoGen sont excellents pour le prototypage, mais ils échouent souvent en production lorsque les agents fonctionnent pendant des heures ou des jours », explique-t-il. Patel ajoute que les capacités de journalisation d’événements, de capture instantanée et de récupération de connexion d’Agent Executor répondent directement aux besoins des équipes SRE.

Gaurav Dewan, research director chez Avasant, souligne l’importance des garanties opérationnelles comme le sandboxing sécurisé et la sauvegarde de points de contrôle pour l’analyse des incidents et l’auditabilité. Cependant, il rappelle que ces fonctionnalités ne résolvent pas entièrement les défis de gouvernance et de surveillance des déploiements d’IA en entreprise. « Les questions de responsabilité, d’explicabilité des décisions, d’application des politiques et d’accès sécurisé entre systèmes interconnectés restent en évolution », précise-t-il.

Une stratégie inspirée de Kubernetes

La stratégie de Google avec Agent Executor rappelle celle adoptée pour Kubernetes il y a une décennie. En offrant un runtime open source, Google vise à stimuler l’adoption de ses services cloud comme la Gemini Enterprise Agent Platform et l’API Managed Agents. Les hyperscalers, dont Microsoft avec AutoGen et AWS avec Bedrock AgentCore, suivent une tendance similaire en promouvant des frameworks ouverts ou interopérables pour gagner un avantage stratégique.

Patel note que les hyperscalers ont compris que les frameworks propriétaires d’agents ne seraient pas adoptés à grande échelle. « L’argent se trouve dans la consommation cloud, les services gérés et l’inférence de modèles. Les outils doivent être ouverts pour gagner la confiance des entreprises », conclut-il.

Cette initiative marque une étape cruciale dans l’évolution des infrastructures pour les agents IA, renforçant la position de Google dans un marché en pleine expansion.