Disaster recovery on AWS: strategies for SMBs
How to design a disaster recovery plan on AWS adapted to your budget and availability requirements.
Updated on 6 August 2024
Protect your business against disruptions
Un plan de disaster recovery (disaster recovery) définit comment votre entreprise reprend son activité après une panne majeure : défaillance matérielle, erreur humaine, cyberattaque ou catastrophe naturelle. Sur AWS, plusieurs stratégies existent avec des niveaux de protection et de coût différents. Le choix dépend de deux métriques : le RTO (temps de reprise acceptable) et le RPO (perte de données maximale acceptable).
The four disaster recovery strategies
Backup and restore
The simplest and least expensive strategy. Vos données sont sauvegardées régulièrement vers Amazon S3 dans une autre région. In case of sinistre, vous recréez l’infrastructure et restaurez les données. Le RTO est de plusieurs heures (le temps de recréer l’infrastructure) et le RPO dépend de la fréquence de vos sauvegardes.
Cette stratégie convient aux applications non critiques et aux PME avec un budget limité. Le coût se limite au stockage S3 des sauvegardes, soit quelques euros per month pour la plupart des PME.
Pilot light
A minimal infrastructure runs permanently dans une seconde région AWS : database répliquée, configuration réseau prête. In case of sinistre, vous démarrez les serveurs d’application et basculez le trafic. Le RTO est de 30 minutes à 2 heures et le RPO est de quelques minutes grâce à la réplication continue de la database.
Le coût est modéré car seule la database et quelques composants réseau tournent en permanence. Les serveurs d’application ne sont démarrés qu’en cas de besoin.
Warm standby
A reduced version of your infrastructure tourne en permanence dans la seconde région. Les serveurs d’application sont actifs mais avec une capacité réduite. In case of sinistre, vous augmentez la capacité et basculez le trafic. Le RTO est de quelques minutes et le RPO est quasi nul.
Active-active (multi-site)
Your infrastructure runs at full capacity dans deux régions simultanément. Le trafic est réparti entre les deux régions. In case of défaillance d’une région, l’autre absorbe tout le trafic automatiquement. Le RTO et le RPO sont quasi nuls, mais le coût est le double de votre infrastructure normale.
AWS services for disaster recovery
AWS Backup centralizes backup management pour EC2, RDS, DynamoDB, EFS et S3. You define des politiques de sauvegarde (fréquence, rétention, réplication inter-régions) et AWS Backup les exécute automatiquement.
Amazon RDS supports replication multi-AZ (high availability dans une région) et les réplicas en lecture inter-régions (disaster recovery). Aurora offre une réplication globale avec un basculement automatique en moins d’une minute.
Route 53 manages DNS failover avec des health checks. Si votre infrastructure principale ne répond plus, Route 53 redirige automatiquement le trafic vers l’infrastructure de secours.
Test your plan regularly
An untested disaster recovery plan est un plan qui ne fonctionne pas. Plan des tests trimestriels qui simulent un sinistre et mesurent le RTO et le RPO réels. Document les résultats et ajustez le plan en conséquence.
LCMH conçoit des plans de disaster recovery sur AWS adaptés au budget et aux exigences des PME alsaciennes.
For cost optimization, read our article on les 7 leviers d’optimisation AWS.
Sources
- AWS, Disaster Recovery of Workloads on AWS. docs.aws.amazon.com/whitepapers/latest/disaster-recovery-workloads-on-aws
- AWS, AWS Backup. aws.amazon.com/backup
- AWS, Reliability Pillar - Well-Architected Framework. docs.aws.amazon.com/wellarchitected/latest/reliability-pillar
Frequently asked questions
- Quelle est la différence entre backup et disaster recovery ?
- Le backup est une copie de vos données que vous restaurez manuellement en cas de perte. Le disaster recovery est un plan complet qui inclut les données, l'infrastructure et les procédures pour remettre votre système en service dans un délai défini. Le backup est un composant du disaster recovery.
- Combien coûte un plan de disaster recovery sur AWS ?
- Le coût dépend de votre stratégie. Un backup simple vers S3 coûte quelques euros per month. Une architecture pilot light (infrastructure minimale en veille) coûte 50 à 200 € per month. Une architecture active-active (deux régions en parallèle) coûte le double de votre infrastructure normale.
- Quel RTO et RPO viser pour une PME ?
- For most des PME, un RTO (temps de reprise) de 1 à 4 heures et un RPO (perte de données maximale) de 1 heure sont un bon compromis entre coût et protection. Les applications critiques (e-commerce, ERP) peuvent justifier un RTO plus court.
Related Articles
Serverless on AWS: why SMBs are adopting it
How serverless architecture on AWS helps SMBs reduce infrastructure costs and focus on their core business.
AWS Lambda: 10 concrete use cases to automate your business
Discover 10 practical AWS Lambda use cases to automate your business processes without managing servers.
CloudFormation vs Terraform: which Infrastructure as Code tool to choose?
Objective comparison between AWS CloudFormation and HashiCorp Terraform for managing your cloud infrastructure as code.
Optimize your AWS costs: 7 concrete levers
Reduce your AWS bill by 20 to 40% with these 7 cloud cost optimization levers accessible to all businesses.
AWS Raised Prices 15%? No, It's More Complicated Than That
Unpacking the AWS EC2 Capacity Blocks pricing adjustment: why alarmist headlines miss the point about dynamic pricing in cloud computing.
The Well-Architected Framework explained for business leaders
Understanding the 6 pillars of the AWS Well-Architected Framework to make informed decisions about your cloud infrastructure.