Stability AI annonce la sortie de Stable Diffusion 3 !

Il y a quelques heures, Stability AI a présenté son tout nouveau générateur d’images baptisé Stable Diffusion 3. Comme ses prédécesseurs, il peut créer des visuels percutants sur divers sujets avec une qualité et une précision améliorées dans la génération de texte. Bien que l’annonce ne s’accompagne pas d’une démo officielle, la société a ouvert aujourd’hui une liste d’attente pour les futurs utilisateurs.

Stable Diffusion 3 génération avec l'invite : photographie en studio en gros plan d'un caméléon sur fond noir.
Crédit Photo : Stability AI

Un générateur avec des performances améliorées

Selon Stability AI, Stable Diffusion 3 (SD3) a une taille allant de 800 millions à 8 milliards de paramètres. Cela permet à diverses versions du modèle de s’exécuter localement sur une variété d’appareils comme les smartphones et les serveurs. Pour rappel, la taille des paramètres détermine la capacité du générateur à fournir des réponses précises aux requêtes des utilisateurs. De plus, les grands modèles nécessitent aussi plus de VRAM sur les accélérateurs GPU pour fonctionner correctement.

En ce qui concerne les performances de Stable Diffusion 3, Emad Mostaque, PDG de Stability, affirme sur X : « Cela utilise un nouveau type de transformateur de diffusion (similaire à Sora) combiné à une adaptation de flux et à d’autres améliorations. Cela profite des améliorations du transformateur et peut non seulement évoluer davantage, mais aussi accepter les entrées multimodales ». Stable Diffusion 3 utilise donc une architecture de transformateur de diffusion.

Il s’agit d’une nouvelle façon de générer des images avec de l’IA. Elle consiste à remplacer les éléments de construction d’images habituels par un système qui fonctionne sur de petits morceaux de l’image. Par ailleurs, le générateur d’image de Stability AI utilise aussi la correspondance de flux. C’est une technique qui permet de créer des modèles IA capables de générer des images en passant d’un bruit aléatoire à une image structurée. Le plus intéressant, Stable Diffusion 3 le fait sans simuler chaque étape du processus.

À lire aussi : Stability AI ajoute de nouvelles fonctions à ses outils pro !

Concurrencer les modèles de synthèse d’image de pointe

Pour le moment, il n’est pas possible d’accéder à l’interface de Stable Diffusion 3. Le générateur promet toutefois de meilleures performances si on se réfère aux échantillons disponibles sur le site web de Stability AI. L’idée est de concurrencer les autres modèles de synthèse d’images de pointe tels que DALL-E 3, Adobe Firefly, Google Imagen et Midjourney. SD3 semble très bien gérer la génération de textes dans les exemples fournis par d’autres, qui sont potentiellement triés sur le volet.

Bien que le générateur d’image ne soit pas largement disponible, Stability AI tient à rassurer ses fidèles utilisateurs. Une fois les tests achevés, la société indique qu’ils pourront télécharger et exécuter localement ses différents modèles. C’est pourquoi elle affirme : « Cette phase de prévisualisation, comme pour les modèles précédents, est cruciale pour recueillir des informations permettant d’améliorer ses performances et sa sécurité avant une version ouverte ».

Source : ARS Technica

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.