Nvidia a créé une IA capable de transformer un dessin tout pourri en magnifique paysage

Ceux d’entre nous qui sont moins dotés d’une fibre artistique que d’autres pourraient bien voir dans la nouvelle IA développée par Nvidia un bon moyen d’exprimer tout leur potentiel en matière d’art visuel. Les plus casaniers pourront, quant à eux, en quelques clics se fabriquer des scènes virtuelles d’escapades qu’ils pourront partager à loisir.

Si vous vous demandez ce dont il s’agit, apprenez que Nvidia a récemment développé un programme d’apprentissage automatique, baptisé GauGAN (Generative adversial networks). Il permet de créer des scènes de paysage très réalistes sur la seule base de la position relative d’éléments sélectionnés par l’utilisateur.

Nvidia a créé une IA capable de transformer un dessin tout pourri en magnifique paysage

Crédits pixabay.com

Le programme arrive ainsi à générer des images de très bonne facture, notamment en faisant appel à ce qu’on lui a appris lors d’un processus d’auto-apprentissage (en  ayant recours à des millions d’images qu’il a appris à analyser) afin de créer une scène unique.

Un outil pour créer des images de toutes pièces

Afin d’obtenir une image via le programme de Nvidia, l’utilisateur devra sélectionner au niveau de l’interface les différents éléments dont il aura besoin pour la scène. Les éléments prédéfinis comprennent par exemple le ciel, des nuages, du sable, la mer, des arbres…

Après avoir sélectionné un élément, il n’aura qu’à le peindre en tant que bloc de couleur au niveau de l’interface, cela va indiquer au programme la place relative de l’objet qu’il devra insérer dans la scène.

Une fois tous les éléments mis en place, le programme va générer la scène, de manière à ce que les images choisies pour construire le résultat final soient considérées comme des éléments réalistes via un processus discriminatoire.

Une IA génératrice et une IA discriminante

Au cours du processus de création, le programme fera appel à deux types d’IA. La première, une IA génératrice d’images, va sélectionner dans la base de données contenant des millions de photos les images qui correspondent aux éléments choisis par l’utilisateur.

Dans un second temps, les images sélectionnées par la première IA seront présentées à une IA discriminante qui va analyser et décider si l’image présentée par l’IA génératrice est assez réaliste pour ne pas être considéré comme sa création.

En gros, l’image n’apparaît sur la scène finale que si l’IA génératrice a créé une image capable de tromper l’IA discriminatrice. Ce qui, au final, conduit à des résultats très réalistes reproduisant des paysages montés de toutes pièces.

Mots-clés nvidia