Vad är Big Data
Bearbetning av stora datavolymer
Big Data — teknologier och metoder för att arbeta med data som är för stor eller komplex för traditionella bearbetningsverktyg.
Egenskaper (5V)
- Volume — datamängd (terabytes, petabytes)
- Velocity — hastighet för generering och bearbetning
- Variety — mångfald av datatyper
- Veracity — tillförlitlighet och kvalitet
- Value — affärsvärde
Teknologier
- Hadoop — distribuerad lagring (HDFS)
- Spark — snabb minnesbaserad bearbetning
- Kafka — dataströmning
- Elasticsearch — sökning och analys
- Data Lake — datasjöar (S3, Azure Data Lake)
Affärsapplikationer
- Kundanalys — segmentering, personalisering
- Prediktiv analys — efterfrågeprognos
- Bedrägeridetektering — transaktionsanalys
- Driftsoptimering — logistik, tillverkning
- Marknadsföring — kampanjeffektivitetsanalys