Hva er Stable Diffusion
Modell for å generere bilder fra tekstbeskrivelser
Stable Diffusion er en åpen kildekode maskinlæringsmodell for å generere bilder fra tekstbeskrivelser, utviklet av Stability AI.
Hvordan det fungerer
- Tekstprompt konverteres til embedding
- Modellen fjerner gradvis støy fra tilfeldig bilde
- Styres av tekstbeskrivelse (CLIP)
- Resultatet er et bilde som matcher prompten
- Latent diffusion: arbeider i komprimert rom
Funksjoner
- Tekst-til-bilde-generering
- Bilderedigering (inpainting)
- Stiloverføring (img2img)
- Oppløsningsøkning
- Variasjonsgenerering
Fordeler
- Åpen kildekode
- Kjører på forbruker-GPU-er
- Bilder av høy kvalitet
- Aktivt fellesskap
- Mange utvidelser og modeller
Forretningsanvendelser
- Opprettelse av markedsføringsmateriell
- Designprototyping
- Generering av innhold for sosiale medier
- Konseptkunst og visualisering
- Personaliserte bilder
Verktøy
- Automatic1111 WebUI
- ComfyUI
- InvokeAI
- DiffusionBee (macOS)
- Draw Things (iOS)
Versjoner
- SD 1.5 — stabil basisversjon
- SD 2.0/2.1 — forbedret kvalitet
- SDXL — høy oppløsning (1024x1024)
- SD 3 — nyeste arkitektur