Was ist Stable Diffusion
Modell zur Bilderzeugung aus Textbeschreibungen
Stable Diffusion ist ein Open-Source-Machine-Learning-Modell zur Generierung von Bildern aus Textbeschreibungen, entwickelt von Stability AI.
Funktionsweise
- Text-Prompt wird in Embedding umgewandelt
- Modell entfernt schrittweise Rauschen aus zufälligem Bild
- Gesteuert durch Textbeschreibung (CLIP)
- Ergebnis ist ein Bild, das dem Prompt entspricht
- Latent Diffusion: arbeitet im komprimierten Raum
Fähigkeiten
- Text-zu-Bild-Generierung
- Bildbearbeitung (Inpainting)
- Stilübertragung (img2img)
- Auflösungserhöhung
- Varianten-Generierung
Vorteile
- Open Source
- Läuft auf Consumer-GPUs
- Hochwertige Bilder
- Aktive Community
- Viele Erweiterungen und Modelle
Geschäftsanwendungen
- Erstellung von Marketingmaterialien
- Design-Prototyping
- Social-Media-Content-Generierung
- Konzeptkunst und Visualisierung
- Personalisierte Bilder
Werkzeuge
- Automatic1111 WebUI
- ComfyUI
- InvokeAI
- DiffusionBee (macOS)
- Draw Things (iOS)
Versionen
- SD 1.5 — stabile Basisversion
- SD 2.0/2.1 — verbesserte Qualität
- SDXL — hohe Auflösung (1024x1024)
- SD 3 — neueste Architektur