Gemini 2.0 Flash : Comment bien prompter l'IA Image de Google ?

Google vient de sortir un nouveau modèle d'IA image : Gemini 2.0 Flash (Image Generation). L'outil est aussi puissant que Photoshop, en retouche photo, à condition de bien le prompter.

Vous n'avez pas pu passer à côté du buzz "Gemini 2.0 Flash (Image Generation)". Chaque jour qui passe depuis la mise à disposition de l'outil dans le Google AI Studio, les internautes se donnent à coeur-joie sur X/Twitter, TikTok, Youtube pour créer des retouches photo dignes d'un designer professionnel.

Photo de portrait qui devient un profil Linkedin professionnel, liasse de billets de 100 dollars qui remplace un smartphone tenue en main, miniature YouTube qui devient plus expressive pour attirer les clics, tout est possible avec cette nouvelle IA Image de Google.

Il faut prompter Gemini 2.0 Flash en anglais et ajouter en contexte l'image que vous souhaitez modifier

Pour pouvoir jouer avec la nouvelle IA Image de Google, rendez-vous d'abord sur le Google AI Studio et choisissez ensuite le nouveau modèle "Gemini 2.0 Flash (Image Generation)" (1). Ensuite, il va falloir lui parler en anglais (3) pour optimiser vos générations d'image. Car comme tout modèle de diffusion d'image, Gemini 2.0 Flash a été entraîné sur des milliards d'images labellisées en anglais.

La force de cette nouvelle IA Image réside dans sa capacité à déformer ou améliorer des images existantes. Donc en plus de décrire en anglais les changements que vous souhaitez apporter, uploadez l'image (2) que vous souhaitez retoucher.

Pour vous faciliter la tâche, je vous propose 5 prompts rédigés en anglais prêts à l'emploi pour réaliser les retouches photos les plus courantes.

1- Nouveau dress code : costume-cravate

A droite : Image générée avec Gemini Flash 2.0 à partir de la photo de l'auteur

Le prompt : Put me in an elegant, tailored suit and tie with proper formal attire for a business setting

2- Nice devient Cannes à la Promenade des Anglais

Image générée avec Gemini Flash 2.0 à partir de la photo de l'auteur

Le prompt : Change existing text “Nice” to custom wording “Cannes” with matching font style and placement.

3- Rendre riche un possesseur de smartphone recyclé

Avant : 

Photo prise par l'auteur

Le prompt : Change the object in my hand to something more impressive like A bundle of 100-dollar bills

Après :

Image générée avec Gemini Flash 2.0

4- L'effet gomme magique

Avant : 

Image générée avec Flux.1 sur Le Chat

Le prompt : Remove the man and the woman from the scene while maintaining background continuity

Après : 

Image générée avec Gemini Flash 2.0

5- On peut même retirer du texte d'une miniature YouTube

Avant :

Miniature YouTube créé avec Canva et Flux.1 + LoRA

Le prompt : Remove all text overlays and watermarks for a clean, unobstructed image

Après :

Image générée par Gemini Flash 2.0