Vad är Apache Kafka
Plattform för händelseströmning
Apache Kafka är en distribuerad händelseströmningsplattform designad för att hantera stora volymer data i realtid.
Kärnkoncept
- Topic — kategori för att organisera meddelanden
- Partition — ämnesindelning för parallellism
- Producer — meddelandesändare
- Consumer — meddelandemottagare
- Broker — Kafka-server
- Consumer Group — konsumentgrupp för lastbalansering
Fördelar med Kafka
- Hög genomströmning (miljontals meddelanden/sek)
- Horisontell skalning
- Långsiktig meddelandelagring
- Leveransgarantier (at-least-once, exactly-once)
- Feltolerans genom replikering
Tillämpningar
- Event-Driven Architecture — mikrotjänstkommunikation
- Loggning — centraliserad logginsamling
- Dataströmning — realtidsanalys
- ETL-pipelines — dataintegration
- IoT — enhetsdata-behandling
Ekosystem
- Kafka Connect — databasanslutningar
- Kafka Streams — strömbehandling i Java
- ksqlDB — SQL för dataströmmar
- Schema Registry — Avro/JSON-schemahantering