Cómo diagnosticar un pico de latencia con Prometheus + Claude
Cuándo usarlo: Se dispara una alerta p99 de un servicio — necesitas contexto sin memorizar PromQL.
Requisitos previos
- URL de Prometheus accesible — Configura PROMETHEUS_URL en la configuración MCP; añade autenticación si está protegido
Flujo
-
Delimita el picoConsulta latencia p99 de solicitud HTTP para el servicio X en la última hora, resolución de 30 segundos. Compara con la línea de base de los últimos 7 días.✓ Copiado→ Resultado de consulta de rango mostrando el pico
-
Encuentra métricas correlacionadasPara la ventana del pico, ¿qué otras métricas del servicio X se movieron >2 sigma? ¿CPU, memoria, GC, profundidad de cola?✓ Copiado→ Métricas candidatas a culpables
-
Restringe por etiquetaDesglosa el pico por etiquetas de pod/host. ¿Es un pod o toda la flota?✓ Copiado→ Descomposición por etiqueta
Resultado: Una hipótesis vinculada a métricas específicas en menos de 5 minutos.
Errores comunes
- La consulta no devuelve datos — Verifica nombres de etiquetas con
list_metrics— el caso de etiqueta y los delimitadores varían entre exportadores