Что такое Stable Diffusion
Модель для генерации изображений по текстовому описанию
Stable Diffusion — открытая модель машинного обучения для генерации изображений по текстовому описанию, разработанная Stability AI.
Принцип работы
- Текстовый промпт преобразуется в эмбеддинг
- Модель постепенно удаляет шум из случайного изображения
- Направляется текстовым описанием (CLIP)
- Результат — изображение, соответствующее промпту
- Latent diffusion: работа в сжатом пространстве
Возможности
- Генерация изображений по описанию (text-to-image)
- Редактирование изображений (inpainting)
- Изменение стиля (img2img)
- Увеличение разрешения (upscaling)
- Генерация вариаций
Преимущества
- Открытый исходный код
- Работает на потребительских GPU
- Высокое качество изображений
- Активное сообщество
- Множество расширений и моделей
Применение в бизнесе
- Создание маркетинговых материалов
- Прототипирование дизайна
- Генерация контента для соцсетей
- Концепт-арт и визуализация
- Персонализированные изображения
Инструменты
- Automatic1111 WebUI
- ComfyUI
- InvokeAI
- DiffusionBee (macOS)
- Draw Things (iOS)
Версии
- SD 1.5 — базовая стабильная версия
- SD 2.0/2.1 — улучшенное качество
- SDXL — высокое разрешение (1024x1024)
- SD 3 — новейшая архитектура