재해 복구(Disaster Recovery)란
클라우드에서는 다양한 트래픽이 몰리는 상황이나 예기치 못한 장애나 공격으로 인해 서버가 다운되었을 경우 혹은 데이터가 날라갔을 경우 이를 백업하는 단계는 매우 중요하다. 그리고 보통 이러한 재해를 복구하는데 평가되는 요소에는 총 두가지가 있다.
RPO(Recovery Point Objective): 어느 시점부터 백업 데이터를 저장할지
RTO(Recovery Time Objective): 백업까지 얼마나 시간이 소요 되는지
이 두가지 요소는 재해 복구를 하는데 있어 매우 중요한 두가지 요소 이며 보통 RPO와 RTO가 낮을수록 좋은 재해 복구 솔루션이라고 하지는 않고, 전체적인 비용까지 따져가며 현재 인프라와 요구사항에 맞는 복구 솔루션을 구축하는 것이 중요하다.
이제 AWS에서는 이러한 재해 복구를 총 3가지 관점에서 정의하고 바라본다.
1. on premise to on premise(전통적인 방식)
2. on premise to AWS(Hybrid 방식)
3. AWS Cloud Region A to Region B
이제 오늘은 강의를 듣고 위 3가지에는 어떠한 방식들이 있고, 어떤 장단점과 특징이 있는지 정리해보았다.
Backup and Restore
특징:
기존 on premise 데이터들을 주기적으로 S3와 S3 Snapshot에 스냅샷을 찍어 보관 한다.
장애가 발생하게 된다면 주기적으로 저장되어 있던 스냅샷으로 AMI를 통해 EC2를 실행시키고, RDS에는 데이터를 이전하여 서비스를 임시로 원활하게 사용할 수 있다.
단점: 높은 RPO와 RTO
장점: 가격이 저렴하고 구축하기 매우 쉽다.
Pilot Light
특징:
EC2같은 경우에는 실행하고 있지 않다가 on premise 서버에 장애가 발생하면 Route 53이 자동적으로 트래픽을 EC2로 보내게 되고 그제서야 EC2가 실행이 된다. 다만, RDS같은 경우에는 주기적으로 메인 DB로 부터 복제하고 저장하기에 꾸준히 실행중에 있다.
장점: 단점이 없는 것이 장점이다. RTO, RPO 둘다 낮다고 할 수 있고 가격 또한 장애 발생 전까지는 RDS에만 지출이 생기기 때문에 저렴하다고 볼 수 있다.
Warm Standby
특징:
모든 시스템이 장애를 대비하기 위해 최소한의 크기로 돌아가고 있다.
사실 Hybrid로 운영하고 있다고 보면 될것 같다. 다만, on premise에서 FailOver가 발생했을 때만 Route 53이 AWS로 로드 밸런싱을 진행해준다.
Multi Site / Hot Site Approach
특징: Warm Standby와 다른점은 최소한의 크기로 대비를 하는지, 최대한의 크기로 대비를 하는지에 따라 달렸다. Multisite 같은 경우 ASG의 크기를 실제 production 환경에 맞추어 사실상 hybrid로 운영하고 있는 셈이나 마찬가지이다.
장점: RTO, RPO가 매우 낮다
단점: 전체적으러 비용이 비싸다
All AWS Multi Region
특징: 재해 복구 솔루션의 끝판왕이다. 같은 환경을 서로 다른 Region에서 운영하여 그 안정성을 최대한으로 높인다. 또한 Aurora DB로 마스터 db 와 slave db를 두어 master db가 죽더라도 slave db에서 다시 살려내어 복구할 수 있다.
장점: RTO, RPO 도 낮고, 매우 안정적인 솔루션
단점: 비용이 매우 비싸다
어떤 재해복구 솔루션을 써야할까?
재해복구 솔루션에는 정답이 없다. 비싸다고 무조건 안좋은 것도 혹은 RTO가 느리다고 무조건 안좋은 것도 아닌 현재 인프라와 요구사항에 맞춰 RPO, RTO 그리고 비용과 안정성 등 다양한 조건을 고려하여 설계하는 것이 정답이라고 한다.
'AWS' 카테고리의 다른 글
AWS Networking: 효율적인 네트워킹 구성하는 법 (0) | 2025.05.15 |
---|---|
AWS Monitoring: CloudWatch vs CloudTrail vs AWS Config 차이 (0) | 2025.05.13 |
AWS Monitoring: CloudWatch란 무엇인가 (0) | 2025.05.13 |
AWS Container: ECS, Fargate 이해하기 (0) | 2025.05.03 |
AWS 통합&메시징: SNS란 무엇이고 언제 사용해야하는가 (1) | 2025.05.02 |