Qué es Rate Limiting
Limitación de la tasa de solicitudes API
Rate Limiting es un mecanismo para limitar el número de solicitudes a una API o servicio dentro de un período de tiempo específico.
Por qué importa el Rate Limiting
- Proteger servidores de sobrecarga
- Prevenir ataques DDoS
- Distribución justa de recursos
- Control de costos de infraestructura
- Garantizar servicio estable para todos los usuarios
Tipos de límites
- Solicitudes por segundo (RPS) — límite clásico
- Solicitudes por minuto/hora — control a largo plazo
- Por usuario — límites individuales
- Por dirección IP — protección contra bots
- Por plan de precios — monetización de API
Algoritmos de implementación
- Token Bucket — tokens en un cubo
- Leaky Bucket — algoritmo de cubo con fugas
- Fixed Window — ventanas de tiempo fijas
- Sliding Window — enfoque de ventana deslizante
Cabeceras HTTP
- X-RateLimit-Limit — solicitudes máximas
- X-RateLimit-Remaining — solicitudes restantes
- X-RateLimit-Reset — tiempo de reinicio del límite
- Retry-After — cuándo reintentar