Hva er Big Data
Behandling av store datavolumer
Big Data — teknologier og metoder for å arbeide med data som er for stor eller kompleks for tradisjonelle behandlingsverktøy.
Egenskaper (5V)
- Volume — datamengde (terabytes, petabytes)
- Velocity — hastighet for generering og behandling
- Variety — mangfold av datatyper
- Veracity — pålitelighet og kvalitet
- Value — forretningsverdi
Teknologier
- Hadoop — distribuert lagring (HDFS)
- Spark — rask behandling i minnet
- Kafka — datastrømming
- Elasticsearch — søk og analyse
- Data Lake — datainnsjøer (S3, Azure Data Lake)
Forretningsapplikasjoner
- Kundeanalyse — segmentering, personalisering
- Prediktiv analyse — etterspørselsprognose
- Svindeldeteksjon — transaksjonsanalyse
- Driftsoptimalisering — logistikk, produksjon
- Markedsføring — kampanjeeffektivitetsanalyse