Aujourd’hui, on teste le nouveau modèle d’intelligence artificielle de génération d’images de Google qui s’appelle Nano Banana. Enfin, ça c’est son nom de code. Le nom officiel c’est Gemini 2.5 Flash image, mais tout le monde utilise Nano Banana.
Et sa particularité, en plus de générer tout types d’images, des images magnifiques, c’est qu’il sait faire de la modification très précise. C’est-à-dire que tu vas lui donner une image ou tu vas générer une image et puis par la suite, tu vas vouloir modifier un petit aspect de cette image. Et ce modèle d’IA va modifier ton petit élément en gardant une cohérence sur tout le reste de l’image. Et ça, c’est quelque chose qui manquait.
Alors spoiler alerte, ce n’est toujours pas parfait mais c’est beaucoup, beaucoup mieux. C’est pour cela que certaines personnes pensent qu’on se rapproche vraiment de l’édition que tu pourrais avoir avec un logiciel de montage comme Photoshop.
Allez, trêve de bavardage, on va tester ce modèle tout de suite.
Générer une image
Allez, premier cas d’usage très, très classique. On va lui demander de générer une photo réaliste d’un chien et dans l’arrière-plan, on peut voir une maison et une famille.
Pour utiliser Nano Banana, je suis allé sur gemini.google.com
, ça sera le plus simple. Tu as aussi Google AI Studio, mais c’est plus dédié aux développeurs.
Et voilà, notre image a été générée. On pourrait croire que c’est une vraie image, même si on zoome dans les détails. Le chien paraît super réaliste.
![Image photoréaliste d'un chien dans un jardin avec une famille en arrière-plan, générée par Nano Banana.]
YouTube : https://youtu.be/i9pkRM193co?t=139](https://didierlaket.com/wp-content/uploads/2025/10/image-5-1024x708.png)
D’ailleurs, tu verras que sur chaque image que tu vas générer, il y aura le petit logo Gini juste en bas à droite, pour indiquer que c’est une image créée via cet outil. Mais petit disclaimer, même si tu essayes de croper l’image, chaque image créée par Nano Banana intègre un filigrane invisible qui s’appelle Synth ID pour certifier que cette image a été générée via une IA.
Modifier une image
Dans ce nouveau cas d’usage, ce que je veux faire, c’est faire plusieurs générations à la suite de la même image pour voir si Nano comprend et sait le faire.
Donc là, je vais donner une image d’un salon avec un casque audio. Moi ce que je veux faire, c’est déjà lui demander de retirer le casque audio et on va voir s’il arrive à garder la même cohérence.
Et voilà notre nouvelle image. Si je zoome, il n’y a quasiment aucune différence avec l’image initiale, mise à part le casque audio. Et il a même reporté l’ombre, il a complété l’ombre qui était cachée par le casque audio. C’est vraiment vraiment impressionnant.

Maintenant, on va lui faire un petit piège. On va lui demander de retirer la plante verte près de la fenêtre… mais il n’y a pas de fenêtre ni de plante verte. Le modèle n’est pas tombé dans notre piège, il me propose même d’en rajouter une.
Maintenant ce que je te propose c’est de changer le tapis et de mettre un tapis berbère. Et quelques minutes plus tard, voilà. Alors, je sais pas si c’est exactement un tapis berbère, mais il a réussi à me mettre un tapis et les détails sont assez impressionnants. On sent que la table pose un poids sur le tapis et que le tapis est un peu affaissé.

Créer des personnages cohérents
Le détective fictif « K »
Première génération, on va lui demander de générer un personnage fictif qu’on appelle K. C’est un détective Cyberpunk avec un trench-coat et une cicatrice sur le visage.
Maintenant, je vais lui demander de générer une autre image de K, sous une pluie de néon dans une ruelle sombre. Et il a réussi à me faire ça. On dirait exactement la même personne, en tout cas le même personnage. Même le manteau est équivalent. Si on zoome sur les petits détails, KL numéro 2 a exactement le même motif. Donc on peut dire qu’il a réussi ce petit test.

La cohérence sur une personne réelle
Maintenant, on va partir de l’image d’un homme pris sur Google. Après quelques essais et des prompts pas assez clairs, j’ai compris que ce qui est très important, c’est le prompt que tu lui donnes.
Ce qu’on va faire, c’est qu’on va prendre cette personne, créer un nouveau chat et partir de zéro : « Gère-moi une image de cette personne dans une voiture à côté d’un immeuble. »
Le résultat est plus ou moins concluant. Moi je donnerai un 7 et demi sur 10. On sent que ce n’est pas exactement la même personne, même s’il a repris certains traits.
L’une des astuces qu’on pourrait employer, c’est de lui donner plusieurs images de notre personnage principal. Donc j’ai copié-collé pas mal d’images de « Bob » et relancé le prompt.
Voilà le résultat. Et sincèrement, j’ai l’impression que le résultat est un peu plus concluant. J’ai moins l’impression que ça soit une IA au niveau des mains, elles paraissent beaucoup plus naturelles et le visage me semble assez similaire.

Fusionner plusieurs images
Nouveau cas d’usage, on va essayer de faire fusionner des images entre elles. Je veux que ce sac là apparaisse sur cette image là et que les deux personnes ci-dessous le portent.
Est-ce que le résultat est convaincant ? Alors, c’est pas vraiment comme ça que j’imaginais le sac porté, mais sincèrement, je trouve que ça le fait à 100 %. C’est vraiment impressionnant. On ne dirait pas que l’image a été générée par une IA. Si on zoome, on peut être un peu tatillon sur certaines parties du logo, mais c’est vraiment des petits détails. La perspective du sac n’est pas la même pour les deux personnes et je trouve que ça marche très bien.

Créer une image à partir d’un dessin
Pour ce nouveau test, on va tester beaucoup de choses : sa capacité à comprendre les dessins, à remplacer des vêtements et à réutiliser des visages.
J’ai pris une photo d’inspiration, je l’ai reproduite en dessin avec des annotations (« on le voit de dos », « on la voit de face »), et j’ai fourni les photos du couple et des tenues désirées (un costume et une robe).




Le prompt est complexe. Je croise les doigts… Oh waouh ! Bon, ça a pas fonctionné comme je voulais malheureusement. Alors, il a bien repris le costume. Il a bien fait en sorte que le marié soit de dos et la mariée de face. Donc ça, c’est vraiment top. Il a compris mon dessin mais il n’a pas totalement remplacé les visages.

Même avec d’autres essais, le résultat reste le même. C’est assez bizarre.
Coloriser ou changer l’époque d’une image
Est-ce que Nano Banana est capable de coloriser une image ? C’est un use case assez classique. Et bien, c’est le cas. C’est un résultat assez convenable, je trouve.


Maintenant, voyons s’il est capable de transformer cette photo pour faire comme si elle avait eu lieu en 2025. Après un premier essai pas « ouf », j’ai amélioré mon prompt en demandant de mettre des tenues modernes, des coiffures, d’ajuster l’environnement, etc.
Oh waouh, c’est beaucoup plus actuel. Il a rajouté un petit écran plat juste derrière, on dirait qu’on est un peu à New York. Le costume a été adapté, la coiffure de la fille a totalement changé. Après, c’est plus du tout la même personne, et il y a quand même des petites imperfections, la main je la trouve très bizarre.

Générer un objet 3D à partir d’une photo
Voici un use case que je trouve assez intéressant : transformer une simple photo en une image 3D. J’ai fait une capture d’écran d’une maison au hasard en Normandie sur Google Maps. On va voir s’il arrive à nous faire une image 3D de cette maison.
Oh non, il a réussi à faire la rampe, c’est assez impressionnant. Waouh ! Ah c’est vraiment génial. C’est fou ça. Il a même rajouté les petites poubelles, les trous d’air… L’escalier, la toiture avec la fenêtre, l’antenne. Non, c’est vraiment impressionnant.


Créer une image à partir d’une carte
Allez, le dernier cas d’usage. On va partir d’une carte et lui demander de nous représenter le point de vue qu’on aurait si on était placé au niveau de la flèche. J’ai pris une photo au hasard, toujours en Normandie.
Et il a compris que c’était un château ! Pourtant, je ne lui ai pas dit. Le résultat est assez bien. On voit bien le cercle juste ici. Par contre, il a écrit « la mote, le bois mode » juste ici comme si c’était encore sur Google Map. On va tester de le corriger.
Je lui demande : « retire l’inscription et rend l’image plus photoréaliste ». Et il a bien réussi à retirer l’inscription. Un peu comme sur Photoshop, on peut faire une petite édition très précise. Bravo Nano Banana.


Conclusion
Pour conclure, tu peux retrouver Nano Banana sur gemini.google.com
. Comme tu l’as vu, c’est un modèle d’IA vraiment impressionnant. Google a vraiment poussé la barre très haute. Le modèle sait créer des images de tout type, enlever des objets, modifier des détails précis uniquement à partir d’un prompt.
On se rapproche de plus en plus de ce qu’on pourrait avoir avec des logiciels professionnels comme Photoshop.
Alors, tout n’est pas encore parfait, tu l’as vu dans mes tests, mais c’est une vraie avancée et ChatGPT, Midjourney ou tous les autres modèles d’image ont du souci à se faire. Ça va permettre à des professionnels d’aller encore plus vite et à des particuliers de faire des modifications super précises où on n’y verra que du feu.
FAQ
Qu’est-ce que Nano Banana et en quoi est-il différent ?
Nano Banana, ou Gemini 2.5 Flash image, est le nouveau modèle de génération d’images de Google. Sa principale différence est sa capacité à effectuer des modifications très précises sur une image tout en gardant une cohérence globale, ce que les autres modèles peinent à faire.
Peut-on créer des personnages cohérents sur plusieurs images ?
Oui. Comme le montrent les tests avec le détective « K » et « Bob », en donnant un nom à un personnage ou en fournissant plusieurs photos de référence, Nano Banana arrive à maintenir une bonne cohérence du visage et des vêtements sur différentes scènes, même si ce n’est pas toujours parfait.
Nano Banana peut-il comprendre des instructions complexes, comme un dessin ?
Oui, il a prouvé sa capacité à interpréter un dessin simple avec des annotations pour comprendre la pose des personnages (un de dos, un de face). Même si le résultat final avait des défauts, la compréhension de l’instruction de base était là.
Comment Nano Banana gère-t-il la fusion de plusieurs images ?
Il est capable de prendre un élément d’une photo (comme un sac) et de l’intégrer de manière réaliste dans une autre image, en l’adaptant à de nouveaux sujets (les deux personnes) et en ajustant la perspective et l’éclairage pour chacun.
Pour aller plus loin, abonne-toi gratuitement à ma newsletter