O que é Rate Limiting
Limitação da taxa de requisições API
Rate Limiting é um mecanismo para limitar o número de requisições a uma API ou serviço dentro de um período de tempo específico.
Por que o Rate Limiting importa
- Proteger servidores contra sobrecarga
- Prevenir ataques DDoS
- Distribuição justa de recursos
- Controle de custos de infraestrutura
- Garantir serviço estável para todos os usuários
Tipos de limites
- Requisições por segundo (RPS) — limite clássico
- Requisições por minuto/hora — controle de longo prazo
- Por usuário — limites individuais
- Por endereço IP — proteção contra bots
- Por plano de preços — monetização de API
Algoritmos de implementação
- Token Bucket — tokens em um balde
- Leaky Bucket — algoritmo de balde furado
- Fixed Window — janelas de tempo fixas
- Sliding Window — abordagem de janela deslizante
Cabeçalhos HTTP
- X-RateLimit-Limit — requisições máximas
- X-RateLimit-Remaining — requisições restantes
- X-RateLimit-Reset — tempo de reset do limite
- Retry-After — quando tentar novamente