Triage eines frischen Production-Incidents in 5 Minuten
Wann einsetzen: PagerDuty hat Sie gerade geweckt. Sentry meldet ansteigende Fehler. Sie müssen schnell wissen, was, warum und ob Sie einen Revert durchführen müssen.
Voraussetzungen
- Sentry-Organisations-Slug + Projekt-Slug — Schauen Sie sich eine beliebige Sentry-URL an: sentry.io/organizations/<ORG>/issues/?project=<ID>
- Sentry-Benutzer-Auth-Token mit
event:readundproject:read— sentry.io/settings/account/api/auth-tokens/
Ablauf
-
Finden Sie das oberste NEUE Problem in der letzten StundeWas ist das oberste neue Problem in unserem
web-prod-Projekt in der letzten Stunde, geordnet nach Event-Anzahl?✓ Kopiert→ Einzelnes Problem mit Titel, Event-Anzahl, betroffene Benutzer, erstmals gesehener Zeitstempel -
Rufen Sie das neueste Event mit vollständigem Stack-Trace + Breadcrumbs abRufen Sie das neueste Event für dieses Problem ab. Zeigen Sie mir den Stack-Trace, das Release und die letzten 5 Breadcrumbs vor dem Crash.✓ Kopiert→ Datei:Zeile der fehlgeschlagenen Funktion + Abfolge von Benutzeraktionen vor dem Fehler
-
Identifizieren Sie das einführende ReleaseWurde dieses Problem zum ersten Mal in demselben Release sichtbar oder ist es übertragen worden? Vergleichen Sie das Release-Tag.✓ Kopiert→ Ja/Nein mit Sicherheit — bestimmt die Revert-Entscheidung
Ergebnis: Eine 3-zeilige Incident-Zusammenfassung, die Sie in Slack einfügen können: was ist kaputt, wer ist betroffen, welches Release hat es verursacht, empfohlene Aktion.
Fallstricke
- Wenn Ihre Release-Tags nicht verbunden sind, können Sie nicht sagen, welche Bereitstellung den Fehler eingeführt hat — Richten Sie
sentry-cli releasesin Ihrer CI ein, bevor Sie sich darauf verlassen — ohne dies ist es eine Vermutung - Stack-Trace ist in minimiertem JS und unleserlich — Vergewissern Sie sich, dass Quellkarten hochgeladen sind —
sentry-cli sourcemaps uploadsollte in Ihrer Build-Pipeline vorhanden sein