Dernière mise à jour le 3 avril 2023
Stable Diffusion est l’un des meilleurs générateurs d’images IA, aidant des millions de ses utilisateurs à créer des images à partir de leurs invites textuelles. Ne vous inquiétez pas, si vous utilisez Stable Diffusion sans être familiarisé avec ce fait, ne vous inquiétez pas.
La lecture ci-dessous vous en informera.
Comment la diffusion stable est-elle formée ?
La diffusion stable est juste un autre processeur de langage neuronal IA. Il fonctionne en traitant les invites de texte humaines pour créer une image ressemblant le mieux qui la représente. LAION a construit ses jeux de données d’images à partir de common crawl, une autre organisation à but non lucratif.
Qu’est-ce que le processus de collecte de données ?
LAION collecte toutes les balises d’image HTML qui comportent des attributs de texte alternatifs. Par la suite, il a classé les 5 milliards de paires d’images en fonction de leur langue globale.
Il a ensuite commencé à filtrer les ensembles de données en fonction de leur résolution, des filigranes et des scores esthétiques prédits.
Formation initiale
La formation initiale de Stable Diffusion était sur une basse résolution d’images de 256 × 256 pixels. Plus tard, il est passé à la haute résolution de LAION, un sous-ensemble de LAION-5b, et il avait 170 millions d’images avec une résolution de plus de 1024 × 1024 pixels. Cependant, ils ont tous été réduits plus tard à 512 × 512 en raison des résultats d’efficacité.
Serait-il possible d’exécuter la diffusion stable avec un GPU ?
Oui, vous pouvez exécuter la diffusion stable sans un GPU de certaines manières possibles. Par exemple, on peut l’utiliser avec DreamStudio, qui est en ligne et ne nécessite pas de mises à niveau matérielles pour fonctionner correctement.
Conclusion
Stable Diffusion utilise différents ensembles de données, mots-clés, artistes et personnages. Étant donné que la technologie de l’IA ne peut rien faire de manière indépendante, elle a toujours besoin de données d’entrée dont la taille compte. Cependant, il est open source et très flexible à utiliser à la portée de tous.