Vad är Stable Diffusion
Modell för att generera bilder från textbeskrivningar
Stable Diffusion är en open source-maskininlärningsmodell för att generera bilder från textbeskrivningar, utvecklad av Stability AI.
Hur det fungerar
- Textprompt konverteras till embedding
- Modellen tar gradvis bort brus från slumpmässig bild
- Styrs av textbeskrivning (CLIP)
- Resultatet är en bild som matchar prompten
- Latent diffusion: arbetar i komprimerat utrymme
Funktioner
- Text-till-bild-generering
- Bildredigering (inpainting)
- Stilöverföring (img2img)
- Upplösningsökning
- Variationsgenerering
Fördelar
- Öppen källkod
- Körs på konsument-GPU:er
- Bilder av hög kvalitet
- Aktivt community
- Många tillägg och modeller
Affärstillämpningar
- Skapande av marknadsföringsmaterial
- Designprototyper
- Generering av innehåll för sociala medier
- Konceptkonst och visualisering
- Personaliserade bilder
Verktyg
- Automatic1111 WebUI
- ComfyUI
- InvokeAI
- DiffusionBee (macOS)
- Draw Things (iOS)
Versioner
- SD 1.5 — stabil basversion
- SD 2.0/2.1 — förbättrad kvalitet
- SDXL — hög upplösning (1024x1024)
- SD 3 — nyaste arkitektur