Mikä on Big Data
Suurten tietomäärien käsittely
Big Data — teknologiat ja menetelmät perinteisille työkaluille liian suurten tai monimutkaisten tietojen käsittelyyn.
Ominaisuudet (5V)
- Volume — datan koko (teratavut, petatavut)
- Velocity — luomis- ja käsittelynopeus
- Variety — datatyyppien monimuotoisuus
- Veracity — luotettavuus ja laatu
- Value — liiketoiminta-arvo
Teknologiat
- Hadoop — hajautettu tallennus (HDFS)
- Spark — nopea muistissa tapahtuva käsittely
- Kafka — tietojen suoratoisto
- Elasticsearch — haku ja analytiikka
- Data Lake — tietoaltaat (S3, Azure Data Lake)
Liiketoimintasovellukset
- Asiakasanalytiikka — segmentointi, personointi
- Ennustava analytiikka — kysynnän ennustaminen
- Petosten tunnistus — tapahtumaanalyysi
- Toiminnan optimointi — logistiikka, valmistus
- Markkinointi — kampanjoiden tehokkuusanalyysi