Amazon CloudWatch : surveiller votre infrastructure AWS efficacement
Guide pratique pour configurer Amazon CloudWatch : métriques, alarmes, dashboards et logs pour garder le contrôle de votre infrastructure cloud.
Mis à jour le 14 May 2025
Garder le contrôle de votre infrastructure cloud
Amazon CloudWatch est le service de monitoring natif d’AWS. Il collecte les métriques, les logs et les traces de tous vos services AWS et de vos applications. Les alarmes vous alertent quand quelque chose ne va pas. Les dashboards visualisent l’état de votre infrastructure en temps réel. Pour les PME sur AWS, CloudWatch est le premier outil à configurer après le déploiement.
Les métriques essentielles à surveiller
EC2
Surveillez l’utilisation CPU, le trafic réseau et le statut des instances. Une utilisation CPU constamment au-dessus de 80% indique un sous-dimensionnement. Une utilisation constamment en dessous de 20% indique un surdimensionnement et un gaspillage de budget.
RDS
Surveillez l’utilisation CPU, la mémoire disponible, les connexions actives et l’espace disque. Une base de données qui manque de mémoire ou de connexions dégrade les performances de votre application.
Lambda
Surveillez les invocations, les erreurs, la durée d’exécution et les throttles. Un taux d’erreur en hausse signale un problème dans votre code ou dans un service dépendant. Les throttles indiquent que vous atteignez les limites de concurrence.
S3
Surveillez le nombre de requêtes, les erreurs 4xx/5xx et la taille du bucket. Un pic de requêtes 4xx peut indiquer des liens cassés ou des tentatives d’accès non autorisées.
Configurer les alarmes
Les alarmes CloudWatch surveillent une métrique et déclenchent une action quand un seuil est franchi. Configurez au minimum les alarmes suivantes pour chaque environnement de production :
L’utilisation CPU des instances EC2 au-dessus de 80% pendant 5 minutes déclenche un avertissement. Au-dessus de 95% pendant 5 minutes, c’est une alerte critique. L’espace disque RDS en dessous de 20% déclenche un avertissement. Le taux d’erreur Lambda au-dessus de 5% déclenche une alerte.
Les notifications sont envoyées via Amazon SNS. Configurez un topic SNS avec les adresses email de votre équipe. Pour les alertes critiques, ajoutez des notifications SMS ou une intégration Slack.
Créer des dashboards
Les dashboards CloudWatch regroupent les métriques clés sur un seul écran. Créez un dashboard par environnement (production, staging) avec les métriques essentielles : santé des instances, performance de la base de données, taux d’erreur des applications et coûts en temps réel.
Les dashboards automatiques de CloudWatch génèrent une vue d’ensemble de vos services AWS sans configuration. C’est un bon point de départ que vous personnalisez ensuite selon vos besoins.
Centraliser les logs
CloudWatch Logs centralise les logs de vos applications et services AWS. Les logs Lambda sont envoyés automatiquement. Les logs EC2 nécessitent l’installation de l’agent CloudWatch. Les logs d’application sont envoyés via le SDK AWS.
CloudWatch Logs Insights permet de requêter vos logs avec un langage de requête dédié. Vous recherchez des erreurs, filtrez par période et agrégez les résultats. Cette capacité de recherche est essentielle pour le diagnostic des incidents.
LCMH configure le monitoring CloudWatch pour les infrastructures AWS des PME alsaciennes.
Pour l’optimisation des coûts, consultez notre article sur les 7 leviers d’optimisation AWS.
Sources
- AWS, Amazon CloudWatch. aws.amazon.com/cloudwatch
- AWS, CloudWatch Pricing. aws.amazon.com/cloudwatch/pricing
- AWS, CloudWatch Logs Insights. docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html
Questions fréquentes
- CloudWatch est-il gratuit ?
- CloudWatch inclut un niveau gratuit généreux : 10 métriques personnalisées, 10 alarmes, 1 million de requêtes API, 5 Go de logs ingérés et 5 Go de logs archivés par mois. Pour la plupart des PME, le niveau gratuit couvre les besoins de base.
- Quelle est la différence entre CloudWatch et des outils comme Datadog ?
- CloudWatch est natif AWS, gratuit pour les métriques de base et intégré à tous les services AWS. Datadog offre une interface plus riche, le support multi-cloud et des intégrations tierces plus nombreuses, mais coûte à partir de 15 $/hôte/mois. Pour une infrastructure 100% AWS, CloudWatch est souvent suffisant.
- Comment être alerté en cas de problème ?
- Créez des alarmes CloudWatch sur les métriques critiques (CPU, mémoire, erreurs, latence). Les alarmes envoient des notifications via SNS (email, SMS, Slack). Configurez des seuils d'avertissement (80%) et critiques (95%) pour anticiper les problèmes.
Articles similaires
AWS Cost Anomaly Detection : détecter les dépenses inhabituelles automatiquement
Comment AWS Cost Anomaly Detection surveille vos dépenses cloud et vous alerte en cas de consommation anormale avant que la facture n'explose.
CloudFormation vs Terraform : quel outil d'Infrastructure as Code choisir ?
Comparatif objectif entre AWS CloudFormation et HashiCorp Terraform pour gérer votre infrastructure cloud en tant que code.
AWS Lambda : 10 cas d'usage concrets pour automatiser votre entreprise
Découvrez 10 cas d'usage pratiques d'AWS Lambda pour automatiser les processus de votre entreprise sans gérer de serveurs.
Le Well-Architected Framework expliqué aux dirigeants
Comprendre les 6 piliers du Well-Architected Framework d'AWS pour prendre des décisions éclairées sur votre infrastructure cloud.
AWS augmente ses prix de 15% ? Non, c'est plus compliqué que ça
Décryptage de l'augmentation des tarifs AWS EC2 Capacity Blocks : pourquoi les titres alarmistes passent à côté de l'essentiel sur la tarification dynamique.
Serverless sur AWS : pourquoi les PME s'y mettent
Comment l'architecture serverless sur AWS permet aux PME de réduire leurs coûts d'infrastructure et de se concentrer sur leur métier.