كيفية تشخيص ارتفاع في زمن الانتظار باستخدام Prometheus + Claude
متى تستخدمه: عند تفعيل تنبيه p99 للخدمة — تحتاج إلى السياق دون حفظ PromQL.
المتطلبات الأساسية
- عنوان Prometheus قابل للوصول — عيّن PROMETHEUS_URL في إعدادات MCP؛ أضف مصادقة إذا كانت محمية
الخطوات
-
تحديد نطاق الارتفاعاستعلم عن كمون طلب HTTP p99 للخدمة X في الساعة الأخيرة، بدقة 30 ثانية. قارن مع خط الأساس في آخر 7 أيام.✓ تم النسخ→ نتيجة استعلام النطاق تظهر الارتفاع
-
البحث عن المقاييس المرتبطةلنافذة الارتفاع، ما المقاييس الأخرى للخدمة X التي تحركت أكثر من 2 sigma؟ CPU والذاكرة و GC وعمق الطابور؟✓ تم النسخ→ المقاييس المشتبه بها
-
تضييق النطاق حسب التسميةقسّم الارتفاع حسب تسميات pod/host. هل يتعلق بـ pod واحد أم بالمجموعة كلها؟✓ تم النسخ→ تقسيم حسب التسمية
النتيجة: فرضية مرتبطة بمقاييس معينة في أقل من 5 دقائق.
المزالق
- الاستعلام لا يعيد بيانات — تحقق من أسماء التسميات باستخدام
list_metrics— تختلف حالة التسمية والفواصل بين المُصدّرات