Block 2: 노드 라이프사이클 & 모니터링
실시간 노드 상태 모니터링 및 이벤트 추적
노드 상태 및 Karpenter 이벤트 확인
핵심 Karpenter 메트릭 쿼리
NodePool별 총 노드 수 추적
스케줄 대기 중인 Pod 수 (프로비저닝 필요 신호)
전체 노드 중 Spot 인스턴스 비율
노드 프로비저닝 P99 지연 시간
2분 경고 ~ 안전한 Pod 이동 전체 시퀀스
환경별 노드 최대 수명 설정
안정성과 보안 패치 속도의 균형
NodeClass 변경 시 자동 노드 교체 흐름
| 특성 | AL2023 | Bottlerocket |
|---|---|---|
| 부팅 시간 | 40-60초 | 20-30초 |
| 보안 | 표준 | 강화 (immutable) |
| SSH 접근 | 가능 | 제한적 |
| 패키지 관리 | yum/dnf | API 기반 업데이트 |
| 권장 사용처 | 디버깅 필요 환경 | 프로덕션, 보안 중요 |
Karpenter 및 노드 상태 알림 구성
EKS Auto Mode 운영 준비 상태 점검
노드 라이프사이클 & 모니터링 핵심 내용 정리
kubectl, Prometheus 쿼리로 노드 상태 및 이벤트 추적
2분 경고 내 Pod 안전 이동, PDB 준수
expireAfter, Drift, AlertManager 알림