AWS 모니터링
인프라 관점에 있어 모니터링은 서비스를 계속해서 안정적으로 실행할 수 있도록 하고, 오류가 발생했을때 빠르게 문제를 파악하고 수정할 수 있도록 하는 매우 중요한 기능중 하나이다.
AWS Cloud Watch Metric
CloudWatch 란?
CloudWatch는 AWS 모든 서비스에 지표를 제공한다. (여기서 지표란 서비스의 Peformance)
측정 가능한 지표에는 대표적으로 'CPU 사용률, Networkin, Bucket Size 등이 있다.'
하나의 Metric당 최대 측정 기준은 10개로 진행되며, Metric이 많아지면 CloudWatch 대시보드에 추가해 모든 지표를 한 번에 볼 수 있다. 사진과 같이 다양한 GUI로도 확인이 가능하다.
CloudWatch Metric Stream
CloudWatch Metric Stream 이란?
CloudWatch 외부로 스트리밍 할 수 있다. (Near Real time으로 지연시간이 매우 짧다). 또한 Firhose를 사용하여 수집된 Metric을 원하는 곳에 저장하고 분석이 가능하다.
CloudWatch Logs
* Logs
숫자 기반의 측정값 (CPU 사용률, 메모리 사용량 등) |
* Metrics
텍스트 기반의 이벤트 기록 (에러 메시지, 시스템 메시지 등) |
Log Group: 로그들을 로그 그룹으로 그룹화
Log Stream: 로그 그룹에는 로그 스트림이 있고 애플리케이션 내 인스턴스나 다양한 로그 파일명 또는 컨테이너를 나타낸다.
CloudWatch Logs에서 저장한 로그들은 AWS의 다양한 서비스에서 분석될 수 있다.
1. CloudWatch Logs - Source
CloudWatch Logs "Source"란, 로그 이벤트의 원본(출처)을 의미. 즉, 로그가 어디에서 생성되었는지를 나타내는 정보
웬만한 AWS 서비스에서는 Source로 작동한다.
- SDK, CloudWatch Logs Agent, Cloud Watch Unified Agent
- ElasticBeanStalk(Application에서)
- ECS(Container에서), Lambda 등...
2. CloudWatch Logs - Metric Filter& Source
A. CloudWatch에서는 필터 표현식을 통해 로그를 수집하고 분석 할 수 있다.
-> EX) 특정 IP, ERROR가 들어간 로그 수집
B. Metric Filter를 통해 출현 빈도를 계산해 지표를 만들 수 있다.
C. CloudWatch Logs Insights
-> 로그를 쿼리하고 쿼리를 대시보드에 추가(한번 만들면 빠른 검색 가능)
3. S3 Export
Export까지 12시간으로 Batch 작업으로 저장이 된다.
4. Cloud Watch Logs Subscription
CloudWatch 위에 적용하여 로그를 실시간으로 목적지까지 보내는 필터
5. Cloud Watch Logs for EC2
EC2의 로그를 옮기기 위해서는 가장 먼저 EC2 내에 CloudWatch Logs Agent를 실해하여 로그 파일을 push하고 EC2 인스턴스에 IAM ROLE를 추가해줘야 한다.
(이는 온프레미스 환경에서도 작동한다)
6. CloudWatch Logs Agent & Unified Agent
A. Logs Agent -> 구버전으로 요즘은 사용을 잘 안함
B. Unified Agent
- process, RAM과 같은 세부적인 퍼포먼스 지수를 수집할 수 있다.
- 지표와 로그를 둘 다 사용(기본적으로 Unified Agent가 더 많이 사용되는 이유)
- CloudWatch Log로 로그를 보냄
CloudWatch Alarms
CloudWatch Alarms는 지표에서 알람을 Trigger할 때 사용한다. 또한 Sampling, %, max, min 등의 다양한 옵션을 추가해서 복잡한 경보 정의가 가능하다(AND/OR GATE 포함)
알람 상태는 총 3가지
A. OK: 트리거가 되지 않은 상태
B. INSUFFICIENT_DATA: 상태를 결정할 데이터가 부족한 상태
C. ALARM: 임계값을 넘어 알람이 보내지는 상태
1. CloudWatch Alarm Targets
-> EC2 Instance 동작(종료, 재부팅 등), EC2 Auto Scaling(Scale out or in), SNS 등
2. EC2 Instance Recovery
상태 점검이 이에 해당한다. (ec2 vm 상태 점검, 하드웨어 점검 등)
참고 자료
https://choiblog.tistory.com/197
AWS 모니터링 및 감사
AWS 모니터링 모니터링은 서비스를 계속해서 실행할 수 있게 해주는 중요한 기능 중 하나 AWS CloudWatch Metrics CloudWatch는 AWS 모든 서비스에 지표를 제공 지표(metric)은 모니터링 할 지표 CPU 사용률, net
choiblog.tistory.com
'AWS' 카테고리의 다른 글
AWS Networking: 효율적인 네트워킹 구성하는 법 (0) | 2025.05.15 |
---|---|
AWS Monitoring: CloudWatch vs CloudTrail vs AWS Config 차이 (0) | 2025.05.13 |
AWS Container: ECS, Fargate 이해하기 (0) | 2025.05.03 |
AWS 통합&메시징: SNS란 무엇이고 언제 사용해야하는가 (1) | 2025.05.02 |
AWS 통합&메시징: SQS란 무엇이고 언제 사용해야하는가 (0) | 2025.05.02 |