DragGAN est un logiciel de retouche photo propulsé par l’IA, permettant d’éditer et d’améliorer vos clichés en quelques clics via une interface glisser-déposer. Découvrez tout ce qu’il faut savoir sur cet outil qui pourrait bien faire de l’ombre à Photoshop, et comment apprendre à le maîtriser !
L’intelligence artificielle est la technologie la plus révolutionnaire de ces données, et transforme rapidement tous les secteurs d’activité.
Vous connaissez sans doute ChatGPT capable de générer tout type de texte, MidJourney pour créer des images à partir de descriptions textuelles ou encore MusicLM capable de composer des mélodies.
La révolution IA concerne aussi le domaine de la retouche photo, avec un outil développé par le Max Planck Institute : DragGAN.
Qu’est-ce que DragGAN ?
Il s’agit d’un éditeur de photos utilisant l’IA pour permettre aux utilisateurs de modifier leurs clichés de façon interactive.Il suffit de glisser et déposer les points d’une image pour effectuer des changements. Ainsi, la retouche photo devient un vrai jeu d’enfant.
Tous les points interactifs de la photo sont amovibles et peuvent être déplacés n’importe où sur la photo. Il est ensuite possible d’éditer l’image en les saisissant pour changer leurs positions ou leurs formes.
Chaque modification est appliquée immédiatement sans perte de qualité ni modification de l’apparence générale de l’image.
Comment ça marche ?
Derrière la magie de DragGAN, on retrouve la technologie des réseaux génératifs antagonistes : les GAN ou Generative Adversarial Networks.C’est grâce à ces réseaux de neurones que l’IA a pu apprendre la structure des photos, et peut désormais appliquer cette connaissance à la retouche. Son nom est d’ailleurs l’abréviation de « Drag-based Generative Adversarial Network ».
Contrairement aux outils d’édition photo traditionnels qui se contentent de distordre ou de rogner les pixels existants, DragGAN peut générer du nouveau contenu correspondant à votre intention.
Par exemple, si vous saisissez la bouche d’une personne sur une photo pour la faire sourire, l’éditeur ne va pas simplement étirer ses lèvres, mais aussi générer des dents et ajuster l’expression faciale !
Comme l’expliquent les chercheurs du Max Planck Institute dans l’article scientifique de présentation, « avec DragGAN, n’importe qui peut déformer une image avec un contrôle précis de là où vont les pixels, afin de manipuler la pose, la forme, l’expression et la disposition de diverses catégories comme les animaux, les voitures, les humains ou les paysages ».
De plus, « puisque ces manipulations sont effectuées sur le manifold d’images génératives apprises par une GAN, elles tendent à produire des résultats réalistes même dans des situations compliquées comme l’hallucination d’un contenu occulté ou la déformation de forme suivant constamment la rigidité d’un objet ».
Avec un ordinateur équipé d’un GPU RTX 3090, le processus ne prend que quelques secondes. Il est donc possible de collaborer sur des retouches photo en temps réel afin d’itérer rapidement jusqu’à atteindre le résultat désiré.
À quoi ça sert ?
Quelques clics suffisent pour transformer totalement une photo avec DragGAN. De fait, cet outil a d’innombrables cas d’usage potentiels : création de portraits, posters, flyers, logos, bande dessinée…Il est par exemple possible de changer la forme ou la taille d’une voiture en saisissant ses roues, ses portes, ses vitres ou son capot.
De même, on peut changer la pose et l’expression d’une personne en attrapant sa tête, ses bras, ses jambes, ses yeux ou sa bouche.
Sur une photo de paysage, l’utilisateur peut modifier la disposition et la perspective en prenant les montagnes, les arbres, l’eau ou le ciel.
Ce logiciel transforme la retouche photo en geste naturel et intuitif, et peut donc fortement simplifier toutes les tâches d’édition d’image !
Avantages et inconvénients
Le principal point fort de ce logiciel est bien entendu sa simplicité. N’importe qui peut l’utiliser, quel que soit son niveau d’expérience en édition de photo.
Il s’agit néanmoins d’un puissant outil, permettant d’effectuer une grande variété de retouches sur les images y compris l’ajout ou la suppression d’objets. Par ailleurs, l’utilisation est totalement gratuite.
Malgré ces avantages, DraGAN présente aussi des points faibles. Il est encore en développement et peut donc comporter des bugs.
Par ailleurs, il n’est pas possible de s’en servir pour le montage vidéo ou l’édition d’autres types de fichiers que des images. Ce n’est pas non plus l’outil d’édition d’image IA le plus puissant du marché.
Toutefois, l’équilibre entre ses performances et son accessibilité en fait un excellent choix pour quiconque souhaite effectuer des retouches photo sans pour autant se lancer dans l’apprentissage d’un outil complexe.
Comment utiliser DragGAN ?
Pour utiliser DragGAN, il suffit de l’installer via la page officielle sur GitHub. Vous pouvez ensuite charger une image et commencer à l’éditer.
Vous ne trouverez pas de pinceau, de brosse ou d’autres outils comme sur les logiciels traditionnels. Pour effectuer une retouche, cliquez sur un point de l’image pour le saisir et déplacez-le ou déformez-le.
Aussitôt, l’IA va générer une nouvelle image avec les modifications appliquées. Vous pouvez prévisualiser cette nouvelle image, et effectuer d’autres changements si nécessaire.
Conclusion : DragGAN, l’IA générative qui révolutionne la retouche photo
À l’instar d’autres outils populaires comme ChatGPT ou MidJourney et Stable Diffusion, DragGAN exploite la technologie d’intelligence artificielle générative pour automatiser les tâches créatives.
En l’occurrence, c’est la retouche photo qui devient un jeu d’enfant puisque l’IA semble presque « deviner » l’intention de l’utilisateur et effectuer les changements à sa place.
Les logiciels plus traditionnels et réputés depuis de nombreuses années comme Photoshop n’ont d’autre choix que d’embrasser à leur tour l’innovation sous peine de devenir obsolètes. D’ailleurs, Adobe a déjà lancé sa propre IA Firefly pour faire entrer ses outils dans la nouvelle ère.
Au cours des prochaines années, les avancées dans le domaine de l’intelligence artificielle vont continuer d’ouvrir de nouvelles possibilités dans le domaine de l’édition d’images. Ceci inclut la reconnaissance d’objet automatique, la retouche en temps réel, ou encore le montage vidéo.
Malgré la simplicité d’usage de DragGAN, exploiter tout son potentiel requiert une compréhension approfondie de l’intelligence artificielle.
Une supervision humaine est nécessaire pour améliorer la qualité des résultats produits par l’IA qui peut encore commettre des erreurs. Pour acquérir cette expertise, vous pouvez choisir DataScientest.
Nos formations vous permettent d’apprendre toutes les techniques et les outils requis pour exercer les métiers de la Data Science, comme analyste, scientifique ou ingénieur des données.
Vous découvrirez notamment le Machine Learning et le Deep Learning, les réseaux de neurones, les GAN, et les outils spécialisés comme Keras, TensorFlow ou PyTorch. Ceci vous permettra de comprendre le fonctionnement des logiciels comme DragGAN, et même de créer vos propres modèles !
Au fil des autres modules de nos formations, vous deviendrez aussi expert en analyse de données, business intelligence, dataviz, programmation et bases de données.
À la fin du cursus, vous aurez acquis toutes les compétences nécessaires pour devenir professionnel de la Data Science. Vous recevrez aussi un diplôme reconnu par l’État et une certification de nos partenaires cloud AWS ou Azure.
Toutes nos formations s’effectuent entièrement à distance via le web, et sont éligibles au CPF pour le financement. Ne perdez plus un instant et découvrez DataScientest !
Vous avez tout sur DragGAN. Pour plus d’informations sur le même sujet, découvrez notre dossier sur les GAN et notre dossier sur les réseaux de neurones !