新しい本番インシデントを5分でトリアージ
使うタイミング: PagerDutyがあなたを起動したばかりです。Sentryはエラーが急増していると言っています。何が起こったのか、なぜ起こったのか、リバートすべきかどうかを素早く知る必要があります。
前提条件
- Sentry組織スラッグ + プロジェクトスラッグ — 任意のSentry URLを見てください:sentry.io/organizations/<ORG>/issues/?project=<ID>
event:readとproject:readを持つSentryユーザー認証トークン — sentry.io/settings/account/api/auth-tokens/
フロー
-
過去1時間の新規トップイシューを検索過去1時間の
web-prodプロジェクトにおける新規トップイシューは何ですか?イベント数でランキング。✓ コピーしました→ タイトル、イベント数、影響を受けたユーザー、最初に確認された時刻を含む単一のイシュー -
完全なスタックトレースとブレッドクラムを含む最新のイベントを取得そのイシューの最新イベントを取得してください。スタックトレース、リリース、クラッシュの直前の5つのブレッドクラムを表示してください。✓ コピーしました→ 例外をスローした関数のFile:line + エラー前のユーザーアクションのシーケンス
-
問題を引き起こしたリリースを特定このイシューは最初に表示されたのと同じリリースで最初に確認されましたか、それとも以前のリリースからのものですか?リリースタグを比較してください。✓ コピーしました→ 自信を持ったはい/いいえ — リバート決定を推進
結果: Slackに貼り付けられる3行のインシデント概要:何が壊れたか、誰が影響を受けたか、どのリリースが原因か、推奨アクション。
注意点
- リリースタグが設定されていない場合、どのデプロイがバグを引き起こしたかを判断できません — これに依存する前に、CI内で
sentry-cli releasesを設定してください — これがないと、推測するしかありません - スタックトレースが縮小化されたJSで読めない — ソースマップがアップロードされていることを確認してください —
sentry-cli sourcemaps uploadがビルドパイプラインに含まれるべきです