Was ist Big Data
Verarbeitung großer Datenmengen
Big Data — Technologien und Methoden für die Arbeit mit Daten, die für herkömmliche Verarbeitungswerkzeuge zu groß oder komplex sind.
Eigenschaften (5V)
- Volume — Datenmenge (Terabytes, Petabytes)
- Velocity — Erzeugungs- und Verarbeitungsgeschwindigkeit
- Variety — Vielfalt der Datentypen
- Veracity — Zuverlässigkeit und Qualität
- Value — Geschäftswert
Technologien
- Hadoop — verteilte Speicherung (HDFS)
- Spark — schnelle In-Memory-Verarbeitung
- Kafka — Datenstreaming
- Elasticsearch — Suche und Analytik
- Data Lake — Datenseen (S3, Azure Data Lake)
Geschäftsanwendungen
- Kundenanalytik — Segmentierung, Personalisierung
- Predictive Analytics — Bedarfsprognose
- Betrugserkennung — Transaktionsanalyse
- Betriebsoptimierung — Logistik, Fertigung
- Marketing — Kampagneneffektivitätsanalyse