로그, 메트릭, 최근 배포를 연관지어 CloudWatch 알람 분류하기
언제 쓸까: 알람이 방금 발동했고, 콘솔을 탭하지 않고 '어느 서비스, 어느 배포, 어느 로그 라인'부터 시작하고 싶을 때 사용합니다.
사전 조건
- CloudWatch + CloudFormation 읽기 권한이 있는 AWS 자격증명 — ReadOnlyAccess 관리형 정책이 있는 역할로
aws sso login실행 - aws-cloudwatch-mcp 서버 실행 중 —
uvx awslabs.cloudwatch-mcp-server실행 또는 번들 설치
흐름
-
알람 세부 정보 및 영향을 받는 리소스 가져오기CloudWatch 알람 'prod-api-5xx-high'를 설명합니다. 어떤 리소스를 감시하고, 임계값은 무엇이며, 현재 상태는 무엇입니까?✓ 복사됨→ 알람 설정 및 상태 기록(언제 변경되었는지)
-
위반 주변의 로그 쿼리/aws/ecs/prod-api 로그 그룹에서 알람이 발동하기 10분 전부터 지금까지 Logs Insights 쿼리를 실행합니다. 메시지 템플릿으로 그룹화된 ERROR 레벨 로그 라인을 찾습니다.✓ 복사됨→ 상위 오류 템플릿 및 개수
-
최근 배포와 연관짓기지난 6시간 동안 prod-api 서비스로의 CodeDeploy 배포 나열합니다. 배포 시간이 오류 스파이크와 연관되어 있습니까?✓ 복사됨→ 오류 발생에 맞춘 배포 타임라인
결과: '배포 abc123이 14:22 UTC에 발생한 것은 14:23의 5xx 발생과 연관된다'는 것처럼 구체적인 가설(뒷받침 증거 포함).
함정
- 큰 로그 그룹에 대한 Logs Insights 쿼리가 시간 창 없이 실제 비용을 초래합니다 — 항상 1시간보다 좁은
@timestamp범위를 포함하십시오. MCP는 청구를 막지 않습니다 - 교차 계정 리소스에는 올바른 자격증명 프로필이 필요합니다 — 서버 호출당
AWS_PROFILE환경 변수를 설정합니다. 기본 프로필이 원하는 것이라고 가정하지 마십시오