什么是 Prometheus
监控和告警系统
Prometheus 是一个开源的监控和告警系统,专为从应用程序和基础设施收集指标而设计。
主要特性
- 多维数据模型(标签)
- 强大的PromQL查询语言
- 拉取式指标收集
- 内置告警
- 服务发现
架构
- Prometheus Server — 指标收集和存储
- Exporters — 导出指标的代理
- Alertmanager — 告警管理
- Pushgateway — 用于短期任务
- Grafana — 仪表板可视化
指标类型
- Counter — 仅递增的值
- Gauge — 可增可减的值
- Histogram — 值的分布
- Summary — 分位数和平均值
PromQL示例
rate(http_requests_total[5m])— RPShistogram_quantile(0.95, ...)— p95延迟sum by (instance) (...)— 聚合
集成
- Kubernetes (kube-state-metrics)
- Node Exporter (Linux/Windows)
- MySQL, PostgreSQL, Redis
- Docker, cAdvisor