MCP : 5 cas pratiques pour automatiser vraiment l'IA

MCP : 5 cas pratiques pour automatiser vraiment l'IA Le protocole MCP donne de nouvelles capacités agentiques aux LLM. De la configuration d'un agent vocal à la création de visuels 3D en passant par l'analyse financière temps réel, voici 5 cas d'usage de ce nouveau protocole.

Il promet d'être les yeux et les mains des modèles d'IA générative. Le protocole MCP permet aux grands modèles de langage d'accéder à des informations et d'agir sur le monde réel. Des milliers de serveurs MCP ont vu le jour ces dernières semaines. Malgré une majorité de serveurs développés par la communauté open source, les éditeurs commencent à proposer leur propre MCP officiel. En combinant un ou plusieurs serveurs, il est possible d'automatiser des tâches complexes. En voici 5 exemples concrets.

#1 Un agent vocal avec ElevenLabs

C'est la démonstration la plus bluffante des capacités du MCP. Développé par ElevenLabs, elevenlabs-mcp permet d'automatiser la création d'agent vocaux et même de lancer des callbots. En intégrant le MCP à Claude Desktop, il est possible de demander dans un même prompt de créer un agent vocal contextualisé et enfin de le lancer en appelant un numéro spécifique. A noter que pour l'appel, il est nécessaire de connecter l'API Twilio dans votre compte ElevenLabs. Il est par exemple possible de créer un callbot spécialisé en service client. Sa mission peut consister à rappeler les clients inactifs depuis plusieurs mois afin de comprendre les raisons de leur désengagement.

Prompt de rappel client :

Utilisez ElevenLabs pour créer un agent téléphonique qui contactera mes clients inactifs afin de comprendre pourquoi ils n'ont pas effectué d'achats récemment dans notre boutique. L'agent doit commencer par une introduction polie : 'Bonjour ! Je suis Alan, je travaille avec l'équipe [Nom de la marque]. Je ne vous dérange pas ? Promis, c'est rapide.' Ensuite, l'agent doit poser la question principale : 'Pourquoi n'avez-vous plus acheté dans notre boutique ?' et enchaîner avec maximum 4 questions complémentaires qui s'adaptent intelligemment aux réponses du client. L'agent doit être programmé pour rester courtois, professionnel et attentif aux explications du client. A la fin de la conversation, l'agent doit remercier poliment le client pour son temps et ses réponses. Une fois l'agent configuré et testé, lancez une campagne d'appels sortants avec ElevenLabs (outbound call) avec la liste de numéros suivante : [insérer liste de numéros].

#2 Un bot de réponse WhatsApp automatique

Voici un autre exemple d'utilisation d'ElevenLabs (EL) couplé à WhatsApp. En combinant les capacités de transcription d'ElevenLabs (via elevenlabs-mcp) à la faculté d'envoi et de réception de message vocal de WhatsApp, via whatsapp-mcp (créé, là encore, par un développeur d'ElevenLabs), il est possible d'automatiser la réception et l'envoi de message vocaux, le tout en utilisant des instructions naturelles avec Claude Desktop. Concrètement, Claude utilise ElevenLabs pour les transcrire les messages vocaux de vos contacts et vous pouvez leur répondre vocalement en utilisant la fonctionnalité text-to-speech d'EL. En configurant également un sosie vocal dans EL, vous pouvez même demander à l'IA d'utiliser votre propre voix.

Un prompt vaut mieux que mille mots :

"Accède à WhatsApp et récupère le dernier message vocal de [NOM_CONTACT]. Transcris ce fichier audio via ElevenLabs (speech-to-text) avec haute précision. Présente-moi la transcription complète et propose 5 réponses variées adaptées au contexte et au ton du message. Après ma sélection, convertis ma réponse en audio avec ElevenLabs en utilisant le modèle text-to-speech et l'ID vocal [ID_VOIX] spécifié. Envoie automatiquement cet audio à mon contact sur WhatsApp et confirme l'envoi."

#3 Créer des visuels 3D avec Blender

Autre cas d'usage assez bluffant, il est possible d'utiliser le logiciel de conception 3D Blender avec des prompts. Développé par la communauté, blender-mcp utilise l'API Python de Blender pour lancer des actions dans le logiciel. Avec Claude Desktop, l'IA permet par exemple de créer rapidement une représentation 3D simple ou même des animations. Attention toutefois : selon nos différents tests et pour l'heure, seules les tâches très simples de création 3D peuvent être automatisées.

Prompt pour créer un fleur simple en 3D :

"Crée un rendu 3D d'une fleur minimaliste dans Blender avec une tige fine. Modélise des pétales blancs symétriques disposés en cercle autour d'un centre jaune pâle légèrement surélevé. Place une seule feuille verte à environ un tiers de la hauteur depuis la base de la tige."
© Capture d'écran / JDN

#4 Automatiser son navigateur

Operator en open source. Développé par les équipes Microsoft, playwright-mcp permet d'automatiser la navigation de votre navigateur. Le système se base sur un navigateur adapté de Google Chrome. Contrairement aux agents de navigation qui utilisent des captures d'écran régulière pour se repérer, playwright-mcp utilise une représentation structurée des éléments du web pour naviguer et compléter des formulaires. Avec Claude Desktop, l'outil permet d'automatiser une grande partie des tâches routinières (veille simple, tri d'emails…).

Prompt pour automatiser une veille informationnelle avec un compte rendu par mail :

"Exécute une recherche automatisée via Playwright MCP en consultant les sites spécialisés en intelligence artificielle (TechCrunch, MIT Technology Review, AI News, VentureBeat, Google News) pour identifier et synthétiser les 10 développements les plus significatifs dans le domaine de l'IA survenus au cours des dernières 24 heures, en privilégiant les avancées techniques, les lancements de produits majeurs, les acquisitions notables et les évolutions réglementaires. Pour chaque information, fournis un titre clair, un résumé concis de 3-4 phrases incluant les implications potentielles, et un lien vers la source originale. Présente ces informations dans un format structuré avec une introduction contextuelle et une conclusion mettant en perspective ces développements. Une fois cette recherche compilée, utilise le MCP Gmail pour m'envoyer ces résultats par email à [insérer adresse email], avec pour objet 'Veille IA quotidienne - [date du jour]', en formatant le corps du message en HTML pour une lisibilité optimale et en incluant un indice de fiabilité pour chaque source consultée."

#5 Génération de vidéo automatique

L'éditeur chinois d'IA MiniMax AI a également développé son propre serveur MCP (MiniMax-MCP). Les outils mis à disposition du LLM offrent des fonctionnalités comme la synthèse vocale (text-to-speech) ou encore la génération de vidéo. Pour la génération vidéo, vous pourriez penser que ce n'est pas très utile ? On peut déjà envoyer son prompt sur MiniMax et obtenir une vidéo. Oui, mais il y a un avantage : le MCP permet notamment de tirer parti des capacités des LLM pour créer des prompts spécialement optimisés pour les modèles text-to-video (comme nous l'expliquions dans notre tentative de reproduction du premier film de l'histoire avec l'IA). Il devient alors possible de faire générer au LLM le prompt avant de l'envoyer à MiniMax pour la génération de la vidéo. Ingénieux, non ?

Prompt pour automatiser le process de création vidéo :

"Voici une description en langage naturel d'une scène vidéo attendue : (INSERER DESCRIPTION DE LA SCENE). A partir de cette description, génère un prompt technique optimisé pour le modèle text-to-video de MiniMax, en incluant les éléments visuels essentiels, l'ambiance, le style artistique et les spécifications techniques pertinentes. Structure le prompt avec des mots-clés efficaces et un langage précis qui maximisera la qualité et la fidélité du rendu par rapport à la vision décrite. Une fois le prompt élaboré, adresse-le directement à MiniMax avec son MCP en respectant la syntaxe requise pour une interprétation optimale par le système."

Bonus : l'accès aux données financières mondiales en temps réel

Qui ne rêverait pas d'accéder aux données financières mondiales en temps réel depuis un LLM ? C'est justement le but de Bloomberg MCP. Développé par la communauté open source, le serveur MCP permet de dialoguer avec l'API BLPAPI de Bloomberg. Au sein de Claude Desktop, bloomberg-mcp permet donc d'accéder aux données de marché en temps réel, aux analyses financières, aux cours des actions, aux indices boursiers mondiaux, aux données obligataires, aux devises, aux matières premières, aux informations sur les entreprises cotées, aux actualités économiques et aux prévisions de marché. Il devient ainsi possible d'interroger la base documentaire financière mondiale en quelques phrases.

Exemple d'un prompt pour identifier les 10 actions les plus sous-valorisées du SP500 aujourd'hui (ceci n'est pas un conseil en investissement) :

"Identifie, à l'aide de Bloomberg MCP, les 10 actions du S&P 500 présentant actuellement les ratios cours/bénéfice (P/E) les plus bas. Pour chaque action, indiquez son symbole boursier, le nom de l'entreprise et la valeur précise du ratio P/E"