คืออะไร ข้อมูลสังเคราะห์
ข้อมูลฝึกอบรมที่สร้างขึ้นเทียม
ข้อมูลสังเคราะห์คือข้อมูลที่สร้างขึ้นเทียมซึ่งเลียนแบบข้อมูลจริงโดยรักษาคุณสมบัติทางสถิติและโครงสร้าง
ข้อดี
- ความเป็นส่วนตัว — ไม่มีความเสี่ยงจากการรั่วไหลของข้อมูลส่วนบุคคล
- ความสามารถในการปรับขนาด — สร้างข้อมูลได้ทุกปริมาณ
- ความสมดุลของคลาส — กำจัดความไม่สมดุลได้ง่าย
- สถานการณ์หายาก — การสร้างแบบจำลอง edge cases
วิธีการสร้าง
- โมเดลทางสถิติ — อิงจากการแจกแจง
- GAN — เครือข่ายสร้างแบบแข่งขัน
- VAE — ตัวเข้ารหัสอัตโนมัติแบบแปรผัน
- การจำลอง — การสร้างแบบจำลองทางกายภาพ
การประยุกต์ใช้
- ฝึกโมเดล ML เมื่อข้อมูลมีจำกัด
- ทดสอบระบบประมวลผลข้อมูล
- พัฒนาและดีบักแอปพลิเคชัน
- เพิ่มข้อมูลให้ชุดข้อมูลที่มีอยู่