Développement d'agents no code : Google et Microsoft au coude à coude
Dans le landerneau de l'IA, c'est le mot à la mode. Les agents sont partout, mais comment les définir ? "C'est un modèle de langage orchestrateur qui va invoquer des services en vue d'aller puiser des informations ciblées, par exemple des données météo. Il pourra aussi invoquer un outil pour déclencher une action. D'où le terme agent. Mais ce n'est pas là sa fonction la plus utilisée", répond Yannick de Kercadio, CTO Google chez Daveo, entité de l'ESN Magellan spécialisée dans le conseil en product management et en cloud public.
Il était possible auparavant de coder un programme pour piloter ce processus. Avec l'IA générative, le programme en question sera généré via le LLM en s'adossant à un prompt. Dans notre exemple, le prompt va typiquement demander au modèle de prévoir la météo en fonction de coordonnées GPS. Le modèle en conclura qu'il devra déterminer la zone dont il s'agit avant d'aller glaner l'information sur un service météo disponible sur le web. Pour réaliser une action, il sera aussi capable d'analyser les paramètres de l'API de l'application correspondante pour y accéder.
AWS, Google et Microsoft ont tous les trois développé des outils no code permettant de créer des agents à la volée. Sur ce terrain, Microsoft et Google sont pour l'heure en tête au coude à coude (voir le tableau ci-dessous).
Points forts | Copilot Studio et Azure Agent Service | Amazon Bedrock AI | Agent Designer et Vertex AI Agent Builder |
---|---|---|---|
Plateforme d'IA intégrée | X | ||
Orientation data | X | X | |
Orientation développeur | X | X | |
Richesse de la palette d'outils tiers | X | ||
Agents préinstanciés riches | X | X |
Côté Google, c'est Vertex AI Agent Builder qui est historiquement mis en avant. L'un de ses principaux points forts réside dans sa capacité à lire automatiquement les API pour supporter des sources et outils tiers. La solution s'intègre (comme ses concurrentes) aux offres de l'écosystème cloud du provider. Chez Google, c'est notamment le cas avec Bigquery qui n'a pas d'équivalent sur le marché. "Vertex AI Agent Builder est également en avance sur le plan de l'orchestration de l'expérience d'agent conversationnel", pointe Yannick de Kercadio. Au sein d'Agentspace, qui propose à l'instar de Microsoft de multiples agents sur étagères, Google a récemment dévoilé Agent Designer. Une seconde interface no code qui permet aux citizen developers de mettre au point des agents. Une trentaine d'outils et d'actions préconfigurés y sont accessibles.
Avec Agentspace, Google multiplie les connecteurs. "Cette brique (actuellement en bêta, ndlr) sera utilisable comme une plateforme centralisée via laquelle les agents pourront être partagés au sein des organisations", explique Cyrille Marechal, lean machine learning engineer chez Devoteam.
Amazon et Microsoft courtisent les développeurs
De son côté, Amazon bénéficie d'une communauté d'utilisateurs importante et d'une documentation bien fournie. Malgré son orientation no code, sa solution, baptisée Amazon Bedrock AI, reste avant tout conçue pour les développeurs. Sur ce point, elle propose des SDK pour intégrer aux agents des outils personnalisés. Ce qui en fait finalement une solution peu adaptée à des utilisateurs non-techniques. "AWS va clairement un cran plus loin en matière de développement, beaucoup plus que Microsoft", confirme Dimitri Cabaud, lead data & AI au sein de l'entité Microsoft chez Devoteam. Un point de vue que ne partage pas Yannick de Kercadio pour qui l'offre de l'éditeur de Redmond, via Github Copilot, est justement taillée pour les développeurs. "Quant aux data scientists, il se tourneront beaucoup plus vers Google et Vertex AI", note l'intéressé.
"Amazon se positionne historiquement comme un hub d'intégration aux différents LLM"
Cyrille Marechal ajoute : "Amazon se positionne historiquement comme un hub d'intégration aux différents LLM." Ce qui permet de s'adapter finement au traitement à réaliser. Grâce à Claude, AWS est capable de définir une durée de raisonnement à la seconde, là où Azure OpenAI est beaucoup moins granulaire en proposant trois palier (low, medium et high). Au total, AWS offre une grande diversité de modèles qui pourront s'adapter à différentes configurations. "On retrouve la même logique côté Microsoft. Au sein d'Azure OpenAI, GPT-4 reste meilleur sur les images. Quant à o1, il est plus robuste sur la gestion de texte", pondère Stephan Durey, deputy CEO chez Magellan Partners et CEO de Daveo. Idem côté Agentspace avec pas moins de 200 modèles recensés. Sur ce point, la course est serrée.
Aux côtés d'Azure AI Foundry, Microsoft propose Copilot Studio pour créer des agents sans code. Un environnement, qui à la différence de GitHub Copilot, est à la portée des profils sans compétence en développement. "Grâce à cette solution, les utilisateurs métier pourront échafauder des agents, y connecter des sources de données, et lancer des actions sur des applicatifs ou des bases de données en bénéficiant des centaines de connecteurs fournis via la solution de développement no code Power Automate. Ce qui permettra au final d'obtenir des agents qui vont pouvoir réaliser des actions en passant par un grand nombre d'applicatifs, tels Salesforce, SAP, etc.", égraine Dimitri Cabaud. Guillaume Gérard, head of genAI south & central Europe chez Capgemini, ajoute : "Copilot Studio bénéficie par ailleurs des outils d'IA tiers proposés par Microsoft. Il s'intègre par exemple à ses services de voicebot."
La concurrence de LangChain
"Parmi les alternatives aux builders d'agents des hyperscalers figurent par exemple Relevance AI, ou encore UiPath qui combine le robotic process automation à des LLMs", complète Guillaume Gérard.
Selon une étude que vient de publier le cabinet conseil français AI Builder, l'utilisation des solutions no code des trois hyperscalers ne seraient pour l'heure pas rentables. Pourquoi ? "Parce qu'il est possible de réaliser l'équivalent voire même mieux avec des frameworks open source au premier rang desquels LangChain", répond Pauline de Lavallade, head of AI au sein de Builders Research, le cabinet d'étude d'AI Builders. "Nous croyons à l'approche low code et no code pour développer des agents. Reste qu'il faut laisser le temps aux éditeurs d'affiner leur approche en vue d'automatiser l'orchestration, la création du prompt ReAct (Reason + Act, ndlr) et l'intégration d'outils." Principal défaut pointé du doigt : l'articulation entre le raisonnement du LLM et l'action à mettre en œuvre qui est jugé par AI Builder comme assez mal décrite par les solutions des hyperscalers.