คืออะไร Stable Diffusion
โมเดลสำหรับสร้างภาพจากข้อความ
Stable Diffusion เป็นโมเดลการเรียนรู้ของเครื่องแบบโอเพนซอร์สสำหรับสร้างภาพจากคำอธิบายข้อความ พัฒนาโดย Stability AI
หลักการทำงาน
- พรอมพท์ข้อความถูกแปลงเป็น embedding
- โมเดลค่อยๆ ลบสัญญาณรบกวนจากภาพสุ่ม
- นำทางโดยคำอธิบายข้อความ (CLIP)
- ผลลัพธ์คือภาพที่ตรงกับพรอมพท์
- Latent diffusion: ทำงานในพื้นที่บีบอัด
ความสามารถ
- สร้างภาพจากข้อความ
- แก้ไขภาพ (inpainting)
- ถ่ายโอนสไตล์ (img2img)
- เพิ่มความละเอียด
- สร้างความหลากหลาย
ข้อดี
- โอเพนซอร์ส
- ทำงานบน GPU ทั่วไป
- ภาพคุณภาพสูง
- ชุมชนที่กระตือรือร้น
- ส่วนขยายและโมเดลมากมาย
การประยุกต์ใช้ทางธุรกิจ
- สร้างสื่อการตลาด
- ต้นแบบการออกแบบ
- สร้างเนื้อหาโซเชียลมีเดีย
- Concept art และการแสดงผล
- ภาพส่วนบุคคล
เครื่องมือ
- Automatic1111 WebUI
- ComfyUI
- InvokeAI
- DiffusionBee (macOS)
- Draw Things (iOS)
เวอร์ชัน
- SD 1.5 — เวอร์ชันพื้นฐานที่เสถียร
- SD 2.0/2.1 — คุณภาพดีขึ้น
- SDXL — ความละเอียดสูง (1024x1024)
- SD 3 — สถาปัตยกรรมใหม่ล่าสุด