3 outils IA qui ont fait leurs preuves dans Discover

3 outils IA qui ont fait leurs preuves dans Discover Pour créer les contenus sur Discover, l'IA est utilisée dans différents cas d'usage.

Google Discover propose un flux de contenu personnalisé à l'utilisateur en fonction de ses centres d'intérêt, de ses historiques de recherche, de son emplacement et de son activité dans d'autres applications. Selon les données de la société d'analyse d'éditeurs Chartbeat, évaluées de novembre 2023 à novembre 2024 sur 3 750 sites, Discover est passé de 22,8 % à 25,7 % du trafic de référence. Une opportunité pour nombre d'éditeurs donc.

1. Perplexity, ChatGPT et Claude pour les contenus écrits 

Les référenceurs peuvent se servir de l'IA pour créer leurs propres contenus dans Discover. Par exemple, Fabien Raquidel, consultant SEO, évite de demander simplement à une IA de lui écrire un article avec un ton journalistique. "Je me sers plutôt de l'option Deep Research de Perplexity", lance-t-il. "Objectif : reprendre des informations provenant de différentes sources, en français ou en anglais." Cela doit lui permettre de trouver des éléments originaux, pour faire la différence sur Discover. Une manière de créer du contenu davantage pertinent, dans un secteur où "ceux qui font cela en automatique ont parfois une quarantaine de sites", pointe-t-il. "Et en changent tous les 8 mois environ." 

Clément Pessaux travaille au sein de discover.partners. "J'œuvre avec des médias pour optimiser leur visibilité sur ce flux d'informations, via un système de ref share. C'est-à-dire que je fournis le brief ou l'article complet optimisé pour Discover. Nous partageons ensuite les gains publicitaires avec l'éditeur sur ces articles."

Il se sert d'abord d'une base de données de plus de 600 000 URLs. Créée grâce à ChatGPT et Perplexity, elle est quotidiennement mise à jour. Elle doit lui permettre de trouver des sujets et de croiser les sources pour éviter toute hallucination des IA. Il passe ensuite par Claude d'Anthropic pour la rédaction. "Je mets en place un prompt spécifique en fonction de la thématique, mais aussi un style, pour essayer de donner vie au contenu. Le process est aujourd'hui en grande partie automatisé, mais il y a toujours une dernière relecture et validation du contenu avant sa publication. En effet, sur Discover, si on veut qu'un site perdure dans le temps, le full automatique n'est pas la meilleure option, il faut absolument que les lecteurs apprécient le contenu qu'ils sont en train de lire pour que Google valide dans le temps le site." Il estime qu'il existe " 2 à 3 % des sites d'éditeurs qui fonctionnent bien, avec un vrai retour sur investissement. Car pour la grande majorité, c'est à perte : les revenus sont si faibles que cela engendre des déficits de quelques centaines d'euros par mois."

2. RAG, ML, NLP, extraction d'entités et classification en ML pour différents clients

D'autres référenceurs se servent de l'IA dans le cadre de Discover, afin de répondre aux besoins d'une clientèle "hybride". C'est le cas de Sylvain Deauré, cofondateur de 1492.vision. " Nos clients sont des groupes média, des agences SEO ou des éditeurs de taille diverse. Majoritairement, c'est l'équipe SEO qui nous contacte d'abord, et utilise nos données. Cependant, plus nous avançons et discutons avec les clients, plus nous allons vers des fonctionnalités et des tableaux de bord utilisables directement par la rédaction. Nous sommes davantage dans le temps réel, les alertes et les suggestions."

Dashboard sur un média "people". On retrouve surtout des entités nommées de type "personne" © 1492.vision

1492.vision utilise par exemple un système RAG pour la ré-écriture de titres. " Nous plaçons un titre "classique" en entrée. La génération augmentée de récupération va trouver dans notre base d'articles Discover des titres proches qui ont sur-performés, pour identifier les schémas communs. Un LLM en mode "few shot prompting" utilise ces articles comme référence pour ajuster le style aux exemples qui marchent. Nous proposons plusieurs alternatives à l'éditeur, qui valide de son côté."

Autre exemple de process : la détermination de thèmes sur lesquels un site est considéré comme d'autorité par Google, pour ne pas trop s'en éloigner. "Ici aussi, nous faisons appel à du ML, du NLP, pour Natural Language Processing, et à de l'extraction d'entités. En regroupant toutes les données auxquelles nous avons accès, nous arrivons in fine à assembler des tableaux de bord actionnables. Nous allons par exemple pouvoir comparer un média avec ses concurrents directs, sur la même thématique. Nous obtenons par exemple des alertes, priorisées, sur les sujets et entités que nous n'avons pas traités et qui ont fait de l'audience chez les concurrents."

Autre usage, la classification en Machine Learning. Elle permet à l'algorithme d'apprendre à associer des données d'entrée à des catégories prédéfinies. 1492.vision se sert de cela avec les données les plus exhaustives possible. Le but, par exemple, est de donner une note à un titre, pour savoir si celui-ci est considéré comme trop "accrocheur" pour Google.

Concernant le retour sur investissement, "de mon point de vue, l'utilisation de l'IA n'est pas une question de ROI, mais simplement de survie", souffle Sylvain Deauré. "Sur Discover, où la réactivité est clé, cela fait toute la différence."

3. NLG et IA générative pour les médias

Philippe Yonnet, président du groupe Neper, accompagne essentiellement sur Discover des médias et des journalistes. Il note une mise en retrait de l'IA générative, contrainte par les chartes IA des différents médias d'être supervisée par les journalistes. Celle-ci est aussi coupable de trop d'erreurs factuelles et des biais trop marqués.

"Les modèles utilisés sont donc plutôt ceux de NLG, pour Natural Language Generation, de dernière génération", lance Philippe Yonnet. "Ils utilisent aussi les Transformers, comme GPT ou Gemini, mais avec une approche radicalement différente". On trouve ces outils dans des applications comme la génération de texte autour de résultats sportifs, les cours de bourse, les résultats financiers, ou encore les résultats d'élection. "C'est encore sous utilisé en France, mais c'est en voie d'extension rapide", pointe Philippe Yonnet. Notons que leur utilisation dans des cas d'usage doit permettre des gains de productivité dans les médias. 

Les IA génératives sont quant à elles plutôt appliquées pour aider les journalistes à trouver le bon titre optimisé pour Discover. "Cela fonctionne plutôt très bien", pousse Philippe Yonnet. De nouveaux angles pour les articles sont aussi repérés avec ce procédé. "Par contre, l'IA est indispensable pour l'analyse des statistiques ou pour faire de l'inférence causale, en cas de chute brutale sur une thématique."