Stable Diffusion là gì
Mô hình tạo hình ảnh từ mô tả văn bản
Stable Diffusion là mô hình học máy mã nguồn mở để tạo hình ảnh từ mô tả văn bản, được phát triển bởi Stability AI.
Cách Hoạt động
- Prompt văn bản được chuyển đổi thành embedding
- Mô hình dần loại bỏ nhiễu từ hình ảnh ngẫu nhiên
- Được hướng dẫn bởi mô tả văn bản (CLIP)
- Kết quả là hình ảnh khớp với prompt
- Latent diffusion: hoạt động trong không gian nén
Khả năng
- Tạo hình ảnh từ văn bản
- Chỉnh sửa hình ảnh (inpainting)
- Chuyển đổi phong cách (img2img)
- Nâng cao độ phân giải
- Tạo biến thể
Ưu điểm
- Mã nguồn mở
- Chạy trên GPU tiêu dùng
- Hình ảnh chất lượng cao
- Cộng đồng tích cực
- Nhiều tiện ích mở rộng và mô hình
Ứng dụng Kinh doanh
- Tạo tài liệu marketing
- Thiết kế prototype
- Tạo nội dung mạng xã hội
- Nghệ thuật concept và trực quan hóa
- Hình ảnh cá nhân hóa
Công cụ
- Automatic1111 WebUI
- ComfyUI
- InvokeAI
- DiffusionBee (macOS)
- Draw Things (iOS)
Phiên bản
- SD 1.5 — phiên bản cơ bản ổn định
- SD 2.0/2.1 — chất lượng cải thiện
- SDXL — độ phân giải cao (1024x1024)
- SD 3 — kiến trúc mới nhất