Qu'est-ce que Stable Diffusion
Modèle de génération d'images à partir de descriptions textuelles
Stable Diffusion est un modèle d'apprentissage automatique open source pour générer des images à partir de descriptions textuelles, développé par Stability AI.
Fonctionnement
- Le prompt textuel est converti en embedding
- Le modèle supprime progressivement le bruit d'une image aléatoire
- Guidé par la description textuelle (CLIP)
- Le résultat est une image correspondant au prompt
- Diffusion latente : travaille dans un espace compressé
Capacités
- Génération texte-vers-image
- Édition d'images (inpainting)
- Transfert de style (img2img)
- Augmentation de résolution
- Génération de variations
Avantages
- Open source
- Fonctionne sur GPU grand public
- Images de haute qualité
- Communauté active
- Nombreuses extensions et modèles
Applications Business
- Création de matériaux marketing
- Prototypage de design
- Génération de contenu pour réseaux sociaux
- Art conceptuel et visualisation
- Images personnalisées
Outils
- Automatic1111 WebUI
- ComfyUI
- InvokeAI
- DiffusionBee (macOS)
- Draw Things (iOS)
Versions
- SD 1.5 — version de base stable
- SD 2.0/2.1 — qualité améliorée
- SDXL — haute résolution (1024x1024)
- SD 3 — architecture la plus récente