Stable Diffusion 이란
텍스트 설명에서 이미지를 생성하는 모델
Stable Diffusion은 Stability AI가 개발한 텍스트 설명에서 이미지를 생성하는 오픈소스 머신러닝 모델입니다.
작동 방식
- 텍스트 프롬프트가 임베딩으로 변환
- 모델이 랜덤 이미지에서 노이즈를 점진적으로 제거
- 텍스트 설명(CLIP)에 의해 가이드
- 결과는 프롬프트에 맞는 이미지
- Latent diffusion: 압축된 공간에서 작동
기능
- 텍스트-이미지 생성
- 이미지 편집 (인페인팅)
- 스타일 전이 (img2img)
- 해상도 업스케일링
- 변형 생성
장점
- 오픈 소스
- 소비자 GPU에서 실행
- 고품질 이미지
- 활발한 커뮤니티
- 많은 확장 및 모델
비즈니스 적용
- 마케팅 자료 제작
- 디자인 프로토타이핑
- 소셜 미디어 콘텐츠 생성
- 컨셉 아트 및 시각화
- 개인화된 이미지
도구
- Automatic1111 WebUI
- ComfyUI
- InvokeAI
- DiffusionBee (macOS)
- Draw Things (iOS)
버전
- SD 1.5 — 기본 안정 버전
- SD 2.0/2.1 — 품질 개선
- SDXL — 고해상도 (1024x1024)
- SD 3 — 최신 아키텍처