Aller au contenu

Amazon CloudWatch : surveiller votre infrastructure AWS efficacement

Guide pratique pour configurer Amazon CloudWatch : métriques, alarmes, dashboards et logs pour garder le contrôle de votre infrastructure cloud.

Mis à jour le 14 May 2025

Garder le contrôle de votre infrastructure cloud

Amazon CloudWatch est le service de monitoring natif d’AWS. Il collecte les métriques, les logs et les traces de tous vos services AWS et de vos applications. Les alarmes vous alertent quand quelque chose ne va pas. Les dashboards visualisent l’état de votre infrastructure en temps réel. Pour les PME sur AWS, CloudWatch est le premier outil à configurer après le déploiement.

Les métriques essentielles à surveiller

EC2

Surveillez l’utilisation CPU, le trafic réseau et le statut des instances. Une utilisation CPU constamment au-dessus de 80% indique un sous-dimensionnement. Une utilisation constamment en dessous de 20% indique un surdimensionnement et un gaspillage de budget.

RDS

Surveillez l’utilisation CPU, la mémoire disponible, les connexions actives et l’espace disque. Une base de données qui manque de mémoire ou de connexions dégrade les performances de votre application.

Lambda

Surveillez les invocations, les erreurs, la durée d’exécution et les throttles. Un taux d’erreur en hausse signale un problème dans votre code ou dans un service dépendant. Les throttles indiquent que vous atteignez les limites de concurrence.

S3

Surveillez le nombre de requêtes, les erreurs 4xx/5xx et la taille du bucket. Un pic de requêtes 4xx peut indiquer des liens cassés ou des tentatives d’accès non autorisées.

Configurer les alarmes

Les alarmes CloudWatch surveillent une métrique et déclenchent une action quand un seuil est franchi. Configurez au minimum les alarmes suivantes pour chaque environnement de production :

L’utilisation CPU des instances EC2 au-dessus de 80% pendant 5 minutes déclenche un avertissement. Au-dessus de 95% pendant 5 minutes, c’est une alerte critique. L’espace disque RDS en dessous de 20% déclenche un avertissement. Le taux d’erreur Lambda au-dessus de 5% déclenche une alerte.

Les notifications sont envoyées via Amazon SNS. Configurez un topic SNS avec les adresses email de votre équipe. Pour les alertes critiques, ajoutez des notifications SMS ou une intégration Slack.

Créer des dashboards

Les dashboards CloudWatch regroupent les métriques clés sur un seul écran. Créez un dashboard par environnement (production, staging) avec les métriques essentielles : santé des instances, performance de la base de données, taux d’erreur des applications et coûts en temps réel.

Les dashboards automatiques de CloudWatch génèrent une vue d’ensemble de vos services AWS sans configuration. C’est un bon point de départ que vous personnalisez ensuite selon vos besoins.

Centraliser les logs

CloudWatch Logs centralise les logs de vos applications et services AWS. Les logs Lambda sont envoyés automatiquement. Les logs EC2 nécessitent l’installation de l’agent CloudWatch. Les logs d’application sont envoyés via le SDK AWS.

CloudWatch Logs Insights permet de requêter vos logs avec un langage de requête dédié. Vous recherchez des erreurs, filtrez par période et agrégez les résultats. Cette capacité de recherche est essentielle pour le diagnostic des incidents.

LCMH configure le monitoring CloudWatch pour les infrastructures AWS des PME alsaciennes.

Pour l’optimisation des coûts, consultez notre article sur les 7 leviers d’optimisation AWS.


Sources

  1. AWS, Amazon CloudWatch. aws.amazon.com/cloudwatch
  2. AWS, CloudWatch Pricing. aws.amazon.com/cloudwatch/pricing
  3. AWS, CloudWatch Logs Insights. docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html

Questions fréquentes

CloudWatch est-il gratuit ?
CloudWatch inclut un niveau gratuit généreux : 10 métriques personnalisées, 10 alarmes, 1 million de requêtes API, 5 Go de logs ingérés et 5 Go de logs archivés par mois. Pour la plupart des PME, le niveau gratuit couvre les besoins de base.
Quelle est la différence entre CloudWatch et des outils comme Datadog ?
CloudWatch est natif AWS, gratuit pour les métriques de base et intégré à tous les services AWS. Datadog offre une interface plus riche, le support multi-cloud et des intégrations tierces plus nombreuses, mais coûte à partir de 15 $/hôte/mois. Pour une infrastructure 100% AWS, CloudWatch est souvent suffisant.
Comment être alerté en cas de problème ?
Créez des alarmes CloudWatch sur les métriques critiques (CPU, mémoire, erreurs, latence). Les alarmes envoient des notifications via SNS (email, SMS, Slack). Configurez des seuils d'avertissement (80%) et critiques (95%) pour anticiper les problèmes.

Articles similaires