J’ai testé Nano Banana de Google !

Aujourd’hui, on teste le nouveau modèle d’intelligence artificielle de génération d’images de Google qui s’appelle Nano Banana. Enfin, ça c’est son nom de code. Le nom officiel c’est Gemini 2.5 Flash image, mais tout le monde utilise Nano Banana.

Et sa particularité, en plus de générer tout types d’images, des images magnifiques, c’est qu’il sait faire de la modification très précise. C’est-à-dire que tu vas lui donner une image ou tu vas générer une image et puis par la suite, tu vas vouloir modifier un petit aspect de cette image. Et ce modèle d’IA va modifier ton petit élément en gardant une cohérence sur tout le reste de l’image. Et ça, c’est quelque chose qui manquait.

Alors spoiler alerte, ce n’est toujours pas parfait mais c’est beaucoup, beaucoup mieux. C’est pour cela que certaines personnes pensent qu’on se rapproche vraiment de l’édition que tu pourrais avoir avec un logiciel de montage comme Photoshop.

Allez, trêve de bavardage, on va tester ce modèle tout de suite.

Générer une image

Allez, premier cas d’usage très, très classique. On va lui demander de générer une photo réaliste d’un chien et dans l’arrière-plan, on peut voir une maison et une famille.

Pour utiliser Nano Banana, je suis allé sur gemini.google.com, ça sera le plus simple. Tu as aussi Google AI Studio, mais c’est plus dédié aux développeurs.

Et voilà, notre image a été générée. On pourrait croire que c’est une vraie image, même si on zoome dans les détails. Le chien paraît super réaliste.

Image photoréaliste d'un chien dans un jardin avec une famille en arrière-plan, générée par Nano Banana.]
YouTube : https://youtu.be/i9pkRM193co?t=139 — Image photoréaliste d’un chien dans un jardin avec une famille en arrière-plan, générée par Nano Banana.] YouTube : https://youtu.be/i9pkRM193co?t=139

D’ailleurs, tu verras que sur chaque image que tu vas générer, il y aura le petit logo Gini juste en bas à droite, pour indiquer que c’est une image créée via cet outil. Mais petit disclaimer, même si tu essayes de croper l’image, chaque image créée par Nano Banana intègre un filigrane invisible qui s’appelle Synth ID pour certifier que cette image a été générée via une IA.

Modifier une image

Dans ce nouveau cas d’usage, ce que je veux faire, c’est faire plusieurs générations à la suite de la même image pour voir si Nano comprend et sait le faire.

Donc là, je vais donner une image d’un salon avec un casque audio. Moi ce que je veux faire, c’est déjà lui demander de retirer le casque audio et on va voir s’il arrive à garder la même cohérence.

Et voilà notre nouvelle image. Si je zoome, il n’y a quasiment aucune différence avec l’image initiale, mise à part le casque audio. Et il a même reporté l’ombre, il a complété l’ombre qui était cachée par le casque audio. C’est vraiment vraiment impressionnant.

Comparaison avant/après d'une image de salon où un casque audio a été retiré par l'IA Nano Banana, montrant la cohérence de l'image et l'ajout de l'ombre manquante.
YouTube : https://youtu.be/i9pkRM193co?t=213 — Comparaison avant/après d’une image de salon où un casque audio a été retiré par l’IA Nano Banana, montrant la cohérence de l’image et l’ajout de l’ombre manquante. YouTube : https://youtu.be/i9pkRM193co?t=213

Maintenant, on va lui faire un petit piège. On va lui demander de retirer la plante verte près de la fenêtre… mais il n’y a pas de fenêtre ni de plante verte. Le modèle n’est pas tombé dans notre piège, il me propose même d’en rajouter une.

Maintenant ce que je te propose c’est de changer le tapis et de mettre un tapis berbère. Et quelques minutes plus tard, voilà. Alors, je sais pas si c’est exactement un tapis berbère, mais il a réussi à me mettre un tapis et les détails sont assez impressionnants. On sent que la table pose un poids sur le tapis et que le tapis est un peu affaissé.

Salon avec un tapis berbère ajouté par IA sous la table basse, montrant des détails réalistes comme l'affaissement du tapis.
YouTube : https://youtu.be/i9pkRM193co?t=269 — Salon avec un tapis berbère ajouté par IA sous la table basse, montrant des détails réalistes comme l’affaissement du tapis. YouTube : https://youtu.be/i9pkRM193co?t=269

Créer des personnages cohérents

Le détective fictif « K »

Première génération, on va lui demander de générer un personnage fictif qu’on appelle K. C’est un détective Cyberpunk avec un trench-coat et une cicatrice sur le visage.

Maintenant, je vais lui demander de générer une autre image de K, sous une pluie de néon dans une ruelle sombre. Et il a réussi à me faire ça. On dirait exactement la même personne, en tout cas le même personnage. Même le manteau est équivalent. Si on zoome sur les petits détails, KL numéro 2 a exactement le même motif. Donc on peut dire qu’il a réussi ce petit test.

Deux images du détective cyberpunk "K" dans des situations différentes, montrant la cohérence du personnage (visage, cicatrice, vêtement) maintenue par Nano Banana.
YouTube : https://youtu.be/i9pkRM193co?t=407 — Deux images du détective cyberpunk « K » dans des situations différentes, montrant la cohérence du personnage (visage, cicatrice, vêtement) maintenue par Nano Banana. YouTube : https://youtu.be/i9pkRM193co?t=407

La cohérence sur une personne réelle

Maintenant, on va partir de l’image d’un homme pris sur Google. Après quelques essais et des prompts pas assez clairs, j’ai compris que ce qui est très important, c’est le prompt que tu lui donnes.

Ce qu’on va faire, c’est qu’on va prendre cette personne, créer un nouveau chat et partir de zéro : « Gère-moi une image de cette personne dans une voiture à côté d’un immeuble. »

Le résultat est plus ou moins concluant. Moi je donnerai un 7 et demi sur 10. On sent que ce n’est pas exactement la même personne, même s’il a repris certains traits.

L’une des astuces qu’on pourrait employer, c’est de lui donner plusieurs images de notre personnage principal. Donc j’ai copié-collé pas mal d’images de « Bob » et relancé le prompt.

Voilà le résultat. Et sincèrement, j’ai l’impression que le résultat est un peu plus concluant. J’ai moins l’impression que ça soit une IA au niveau des mains, elles paraissent beaucoup plus naturelles et le visage me semble assez similaire.

Image de "Bob" dans une voiture générée par Nano Banana à partir de plusieurs photos sources, montrant une meilleure cohérence faciale et des mains plus naturelles.
YouTube : https://youtu.be/i9pkRM193co?t=716 — Image de « Bob » dans une voiture générée par Nano Banana à partir de plusieurs photos sources, montrant une meilleure cohérence faciale et des mains plus naturelles. YouTube : https://youtu.be/i9pkRM193co?t=716

Fusionner plusieurs images

Nouveau cas d’usage, on va essayer de faire fusionner des images entre elles. Je veux que ce sac là apparaisse sur cette image là et que les deux personnes ci-dessous le portent.

Est-ce que le résultat est convaincant ? Alors, c’est pas vraiment comme ça que j’imaginais le sac porté, mais sincèrement, je trouve que ça le fait à 100 %. C’est vraiment impressionnant. On ne dirait pas que l’image a été générée par une IA. Si on zoome, on peut être un peu tatillon sur certaines parties du logo, mais c’est vraiment des petits détails. La perspective du sac n’est pas la même pour les deux personnes et je trouve que ça marche très bien.

Deux personnes portant un sac qui a été fusionné depuis une autre image par Nano Banana, avec un éclairage et une perspective adaptés à chaque personne.
YouTube : https://youtu.be/i9pkRM193co?t=861 — Deux personnes portant un sac qui a été fusionné depuis une autre image par Nano Banana, avec un éclairage et une perspective adaptés à chaque personne. YouTube : https://youtu.be/i9pkRM193co?t=861

Créer une image à partir d’un dessin

Pour ce nouveau test, on va tester beaucoup de choses : sa capacité à comprendre les dessins, à remplacer des vêtements et à réutiliser des visages.

J’ai pris une photo d’inspiration, je l’ai reproduite en dessin avec des annotations (« on le voit de dos », « on la voit de face »), et j’ai fourni les photos du couple et des tenues désirées (un costume et une robe).

Le prompt est complexe. Je croise les doigts… Oh waouh ! Bon, ça a pas fonctionné comme je voulais malheureusement. Alors, il a bien repris le costume. Il a bien fait en sorte que le marié soit de dos et la mariée de face. Donc ça, c’est vraiment top. Il a compris mon dessin mais il n’a pas totalement remplacé les visages.

Photo de mariage générée par IA à partir d'un dessin, d'une photo de couple et de tenues. L'IA a respecté la composition du dessin et les vêtements, mais pas les visages.
YouTube : https://youtu.be/i9pkRM193co?t=1044 — Photo de mariage générée par IA à partir d’un dessin, d’une photo de couple et de tenues. L’IA a respecté la composition du dessin et les vêtements, mais pas les visages. YouTube : https://youtu.be/i9pkRM193co?t=1044

Même avec d’autres essais, le résultat reste le même. C’est assez bizarre.

Coloriser ou changer l’époque d’une image

Est-ce que Nano Banana est capable de coloriser une image ? C’est un use case assez classique. Et bien, c’est le cas. C’est un résultat assez convenable, je trouve.

Chat Gemini - Photo vintage en noir et blanc colorisée par l'intelligence artificielle Nano Banana. YouTube : https://youtu.be/i9pkRM193co?t=1153 — Chat Gemini – Photo vintage en noir et blanc colorisée par l’intelligence artificielle Nano Banana. YouTube : https://youtu.be/i9pkRM193co?t=1153

Photo vintage en noir et blanc colorisée par l'intelligence artificielle Nano Banana.
YouTube : https://youtu.be/i9pkRM193co?t=1153 — Photo vintage en noir et blanc colorisée par l’intelligence artificielle Nano Banana. YouTube : https://youtu.be/i9pkRM193co?t=1153

Maintenant, voyons s’il est capable de transformer cette photo pour faire comme si elle avait eu lieu en 2025. Après un premier essai pas « ouf », j’ai amélioré mon prompt en demandant de mettre des tenues modernes, des coiffures, d’ajuster l’environnement, etc.

Oh waouh, c’est beaucoup plus actuel. Il a rajouté un petit écran plat juste derrière, on dirait qu’on est un peu à New York. Le costume a été adapté, la coiffure de la fille a totalement changé. Après, c’est plus du tout la même personne, et il y a quand même des petites imperfections, la main je la trouve très bizarre.

Photo vintage transformée en scène moderne de 2025 par IA, avec des vêtements, coiffures et un arrière-plan actualisés.
YouTube : https://youtu.be/i9pkRM193co?t=1305 — Photo vintage transformée en scène moderne de 2025 par IA, avec des vêtements, coiffures et un arrière-plan actualisés. YouTube : https://youtu.be/i9pkRM193co?t=1305

Générer un objet 3D à partir d’une photo

Voici un use case que je trouve assez intéressant : transformer une simple photo en une image 3D. J’ai fait une capture d’écran d’une maison au hasard en Normandie sur Google Maps. On va voir s’il arrive à nous faire une image 3D de cette maison.

Oh non, il a réussi à faire la rampe, c’est assez impressionnant. Waouh ! Ah c’est vraiment génial. C’est fou ça. Il a même rajouté les petites poubelles, les trous d’air… L’escalier, la toiture avec la fenêtre, l’antenne. Non, c’est vraiment impressionnant.

Chat Gemini - Modèle 3D d'une maison généré par Nano Banana à partir d'une simple capture d'écran de Google Street View, reproduisant fidèlement les détails architecturaux.
YouTube : https://youtu.be/i9pkRM193co?t=1475 — Chat Gemini – Modèle 3D d’une maison généré par Nano Banana à partir d’une simple capture d’écran de Google Street View, reproduisant fidèlement les détails architecturaux. YouTube : https://youtu.be/i9pkRM193co?t=1475

Modèle 3D d'une maison généré par Nano Banana à partir d'une simple capture d'écran de Google Street View, reproduisant fidèlement les détails architecturaux.
YouTube : https://youtu.be/i9pkRM193co?t=1475 — Modèle 3D d’une maison généré par Nano Banana à partir d’une simple capture d’écran de Google Street View, reproduisant fidèlement les détails architecturaux. YouTube : https://youtu.be/i9pkRM193co?t=1475

Créer une image à partir d’une carte

Allez, le dernier cas d’usage. On va partir d’une carte et lui demander de nous représenter le point de vue qu’on aurait si on était placé au niveau de la flèche. J’ai pris une photo au hasard, toujours en Normandie.

Et il a compris que c’était un château ! Pourtant, je ne lui ai pas dit. Le résultat est assez bien. On voit bien le cercle juste ici. Par contre, il a écrit « la mote, le bois mode » juste ici comme si c’était encore sur Google Map. On va tester de le corriger.

Je lui demande : « retire l’inscription et rend l’image plus photoréaliste ». Et il a bien réussi à retirer l’inscription. Un peu comme sur Photoshop, on peut faire une petite édition très précise. Bravo Nano Banana.

Chat Gemini - Vue photoréaliste d'un château générée par IA à partir d'une carte 2D et d'une flèche de direction, avant et après avoir retiré une inscription textuelle de l'image.
YouTube : https://youtu.be/i9pkRM193co?t=1580 — Chat Gemini – Vue photoréaliste d’un château générée par IA à partir d’une carte 2D et d’une flèche de direction, avant et après avoir retiré une inscription textuelle de l’image. YouTube : https://youtu.be/i9pkRM193co?t=1580

Vue photoréaliste d'un château générée par IA à partir d'une carte 2D et d'une flèche de direction, avant et après avoir retiré une inscription textuelle de l'image.
YouTube : https://youtu.be/i9pkRM193co?t=1580 — Vue photoréaliste d’un château générée par IA à partir d’une carte 2D et d’une flèche de direction, avant et après avoir retiré une inscription textuelle de l’image. YouTube : https://youtu.be/i9pkRM193co?t=1580

Conclusion

Pour conclure, tu peux retrouver Nano Banana sur gemini.google.com. Comme tu l’as vu, c’est un modèle d’IA vraiment impressionnant. Google a vraiment poussé la barre très haute. Le modèle sait créer des images de tout type, enlever des objets, modifier des détails précis uniquement à partir d’un prompt.

On se rapproche de plus en plus de ce qu’on pourrait avoir avec des logiciels professionnels comme Photoshop.

Alors, tout n’est pas encore parfait, tu l’as vu dans mes tests, mais c’est une vraie avancée et ChatGPT, Midjourney ou tous les autres modèles d’image ont du souci à se faire. Ça va permettre à des professionnels d’aller encore plus vite et à des particuliers de faire des modifications super précises où on n’y verra que du feu.

FAQ

Qu’est-ce que Nano Banana et en quoi est-il différent ?
Nano Banana, ou Gemini 2.5 Flash image, est le nouveau modèle de génération d’images de Google. Sa principale différence est sa capacité à effectuer des modifications très précises sur une image tout en gardant une cohérence globale, ce que les autres modèles peinent à faire.

Peut-on créer des personnages cohérents sur plusieurs images ?
Oui. Comme le montrent les tests avec le détective « K » et « Bob », en donnant un nom à un personnage ou en fournissant plusieurs photos de référence, Nano Banana arrive à maintenir une bonne cohérence du visage et des vêtements sur différentes scènes, même si ce n’est pas toujours parfait.

Nano Banana peut-il comprendre des instructions complexes, comme un dessin ?
Oui, il a prouvé sa capacité à interpréter un dessin simple avec des annotations pour comprendre la pose des personnages (un de dos, un de face). Même si le résultat final avait des défauts, la compréhension de l’instruction de base était là.

Comment Nano Banana gère-t-il la fusion de plusieurs images ?
Il est capable de prendre un élément d’une photo (comme un sac) et de l’intégrer de manière réaliste dans une autre image, en l’adaptant à de nouveaux sujets (les deux personnes) et en ajustant la perspective et l’éclairage pour chacun.

Pour aller plus loin, abonne-toi gratuitement à ma newsletter

Didier Laket

Didier Laket

No-code, IA, Automatisation