Big Data là gì
Xử lý lượng lớn dữ liệu
Big Data — công nghệ và phương pháp làm việc với dữ liệu quá lớn hoặc phức tạp cho các công cụ xử lý truyền thống.
Đặc điểm (5V)
- Volume — kích thước dữ liệu (terabyte, petabyte)
- Velocity — tốc độ tạo và xử lý
- Variety — đa dạng loại dữ liệu
- Veracity — độ tin cậy và chất lượng
- Value — giá trị kinh doanh
Công nghệ
- Hadoop — lưu trữ phân tán (HDFS)
- Spark — xử lý nhanh trong bộ nhớ
- Kafka — streaming dữ liệu
- Elasticsearch — tìm kiếm và phân tích
- Data Lake — hồ dữ liệu (S3, Azure Data Lake)
Ứng dụng kinh doanh
- Phân tích khách hàng — phân khúc, cá nhân hóa
- Phân tích dự đoán — dự báo nhu cầu
- Phát hiện gian lận — phân tích giao dịch
- Tối ưu hóa vận hành — logistics, sản xuất
- Marketing — phân tích hiệu quả chiến dịch