AWS a-t-il vraiment augmenté ses prix de 15% ?

Non. AWS a ajusté les tarifs des EC2 Capacity Blocks, un mécanisme de réservation très spécifique pour les charges ML. Les prix on-demand, reserved instances et spot n'ont pas changé.

Qu'est-ce qu'un EC2 Capacity Block ?

Un Capacity Block permet de réserver à l'avance des instances GPU groupées dans un même datacenter pour des entraînements ML nécessitant une faible latence entre instances. C'est un service de niche pour des besoins très spécifiques.

Les prix des Capacity Blocks sont-ils fixes ?

Non, et c'était annoncé dès le lancement du service. Les prix varient selon l'offre et la demande, exactement comme les instances spot. L'objectif est d'inciter à utiliser les capacités pendant les creux de demande.

Dois-je m'inquiéter pour ma facture AWS ?

Si vous n'utilisez pas les Capacity Blocks pour ML (ce qui concerne plus de 95% des entreprises), cette modification ne vous affecte pas. Vos instances EC2 classiques conservent leurs tarifs habituels.

AWS augmente ses prix de 15% ? Non, c'est plus compliqué que ça

Un article publié début janvier dans The Register affirme qu’AWS a discrètement augmenté ses prix de 15% un samedi. Le titre est accrocheur. La réalité est nettement moins dramatique.

AWS a ajusté les tarifs des EC2 Capacity Blocks for ML, un mécanisme de réservation très spécifique qui concerne une fraction minuscule des charges de travail cloud. Les prix on-demand, reserved instances et spot pour ces mêmes instances GPU n’ont pas bougé. Décryptons ce qui s’est réellement passé et pourquoi les titres alarmistes passent à côté de l’essentiel.

Ce que sont vraiment les Capacity Blocks

Pour comprendre ce que sont les Capacity Blocks, il faut d’abord situer ce mécanisme dans l’écosystème des options d’achat EC2. AWS propose plusieurs façons de payer vos instances, chacune adaptée à des besoins différents. Les instances on-demand offrent une flexibilité maximale avec un prix fixe à l’heure. Les Savings Plans permettent de réduire les coûts en s’engageant sur un montant d’usage mensuel pendant 1 ou 3 ans. Les instances spot donnent accès à de la capacité inutilisée à prix réduit, mais peuvent être interrompues à tout moment. Les Dedicated Hosts réservent un serveur physique complet pour répondre à des contraintes de licences logicielles.

Les Capacity Blocks for ML se situent dans une catégorie à part. Ce n’est pas une option d’achat comme les autres, mais un mécanisme de réservation de capacité spécifiquement conçu pour les charges de machine learning. Le tableau ci-dessous compare les principales options d’achat EC2 pour mieux situer où interviennent les Capacity Blocks.

Option d'achat	Prix	Disponibilité	Cas d'usage
On-Demand	Fixe	Immédiate (si capacité)	Charges imprévisibles
Savings Plans	Fixe (réduit)	Engagement 1-3 ans	Charges stables, flexibilité instance
Spot Instances	Variable	Non garantie (interruptible)	Charges tolérantes aux interruptions
Dedicated Hosts	Fixe	Serveur physique dédié	Licences logicielles existantes

Réservations de capacité (Capacity Reservations)

En complément des options d'achat ci-dessus, AWS propose des mécanismes de réservation de capacité :

On-Demand Capacity Reservations : Réserve de la capacité dans une zone de disponibilité spécifique
Capacity Blocks for ML : Réserve un cluster d'instances GPU pour entraînement ML (tarification variable)

Les Capacity Blocks permettent de réserver à l’avance des instances GPU pour des entraînements de modèles de machine learning. Vous spécifiez le nombre d’instances (jusqu’à 64), la durée (de quelques jours à plusieurs semaines) et la date de début souhaitée. AWS vous propose jusqu’à trois créneaux disponibles avec leurs tarifs respectifs. Vous payez d’avance et vos instances sont garanties au moment voulu.

La particularité des Capacity Blocks est que les instances sont automatiquement placées dans un même cluster AWS (EC2 UltraCluster) pour minimiser la latence réseau entre elles. Cette proximité physique est cruciale pour les entraînements distribués qui nécessitent des échanges constants entre instances. Un entraînement de modèle de langage sur 32 instances H200 génère des téraoctets de données échangées entre GPU. Chaque milliseconde de latence se multiplie par des millions d’itérations.

Ce service s’adresse à des équipes ML qui exécutent des entraînements planifiés et qui ne peuvent pas se permettre de voir leur job interrompu parce que la capacité spot a disparu. Les budgets se mesurent en dizaines ou centaines de milliers d’euros par entraînement. Ce n’est pas un service grand public.

Une tarification dynamique annoncée dès le départ

Voici ce qu’indiquait la page de tarification des Capacity Blocks dès le lancement du service en 2023 : “EC2 Capacity Block prices are dynamic and depend on total available supply and demand at the time you purchase the EC2 Capacity Block.” Cette phrase figure toujours sur la documentation officielle AWS.

La tarification dynamique n’est pas une nouveauté. Les instances spot fonctionnent sur ce principe depuis plus de dix ans. Le prix varie en temps réel selon l’offre et la demande, avec des fluctuations pouvant atteindre plusieurs centaines de pourcents selon les périodes. Personne ne titre “AWS augmente le prix des spots” quand les tarifs fluctuent. Les Capacity Blocks suivent une logique similaire, avec des ajustements moins fréquents mais tout aussi prévisibles.

L’objectif de cette tarification variable est d’inciter les clients à réserver pendant les périodes de faible demande. Si tout le monde veut des H200 en janvier pour boucler ses projets avant la fin du trimestre fiscal, les prix montent. Si vous pouvez décaler votre entraînement en mars, vous payez moins. C’est un mécanisme d’allocation de ressources rares, pas une augmentation déguisée.

Ce qui n’a pas changé

Les instances p5e.48xlarge et p5en.48xlarge restent disponibles en on-demand aux mêmes tarifs qu’avant. Les Savings Plans (engagement 1 ou 3 ans) n’ont pas bougé. Les instances spot continuent de fluctuer selon leur propre dynamique. Si vous utilisez ces instances GPU sans passer par les Capacity Blocks, votre facture est strictement identique.

Pour la très grande majorité des entreprises qui utilisent AWS, cette modification est invisible. Les instances de calcul classiques (t3, m5, c5, r5), les bases de données RDS, les buckets S3, les fonctions Lambda et tous les autres services conservent leurs grilles tarifaires habituelles. Même pour les charges ML, seuls les clients qui réservent explicitement des Capacity Blocks for ML sont concernés.

Pourquoi les GPU sont sous tension

Les GPU Nvidia H100 et H200 sont devenus la ressource la plus convoitée du cloud. Les chiffres parlent d’eux-mêmes : le marché des GPU pour datacenters IA est passé de 10,5 milliards de dollars en 2025 à une projection de 12,8 milliards en 2026, avec une croissance annuelle de 22%. Nvidia a annoncé que ses puces Blackwell sont vendues jusqu’à mi-2026, avec un carnet de commandes de 3,6 millions d’unités. Pour les H200 spécifiquement, la demande chinoise seule atteint 2 millions de puces alors que Nvidia n’a que 700 000 unités en stock.

Chaque hyperscaler (AWS, Azure, GCP) se bat pour sécuriser des allocations auprès de Nvidia. La demande explose avec la généralisation des modèles de langage et des applications d’IA générative. L’offre ne suit pas au même rythme. Les entreprises qui veulent construire des modèles d’IA de pointe doivent attendre 18 mois ou se rabattre sur les générations précédentes.

Dans ce contexte, AWS ajuste les prix des Capacity Blocks pour refléter la tension sur ces ressources GPU spécifiques. C’est une réponse rationnelle à un déséquilibre offre-demande documenté. Les clients qui ont absolument besoin de capacité garantie à une date précise paient une prime. Ceux qui peuvent être flexibles ou utiliser du spot paient moins.

Cette situation n’est pas propre à AWS. Azure et GCP font face aux mêmes contraintes d’approvisionnement. Les trois clouds ont des listes d’attente pour certaines configurations GPU. La différence est qu’AWS a choisi un mécanisme de prix transparent plutôt qu’un rationnement opaque.

Le vrai sujet : la prévisibilité des coûts cloud

L’article de The Register soulève une question légitime sous son titre sensationnaliste : que se passe-t-il si AWS commence à augmenter régulièrement ses prix ? Pendant vingt ans, le cloud a conditionné les entreprises à attendre des baisses de prix continues. Cette époque touche peut-être à sa fin.

Les coûts de l’énergie augmentent. Les composants électroniques ne suivent plus la loi de Moore au même rythme. Les investissements massifs dans les datacenters pour l’IA créent une pression sur les marges. Il serait naïf de penser que les prix cloud ne peuvent que baisser éternellement.

Pour les entreprises, cela signifie qu’il faut surveiller activement ses coûts cloud plutôt que de compter sur des baisses automatiques. Les outils comme AWS Cost Anomaly Detection, les budgets avec alertes et les revues régulières d’architecture deviennent indispensables. Nous accompagnons nos clients alsaciens dans cette démarche d’optimisation continue, notamment via des audits Well-Architected qui incluent systématiquement le pilier optimisation des coûts.

Ce qu’il faut retenir

AWS n’a pas augmenté ses prix de manière générale. L’ajustement concerne un service de niche avec une tarification dynamique annoncée dès le départ. Les instances GPU restent disponibles aux mêmes tarifs en on-demand et reserved. Les Capacity Blocks restent moins chers que l’on-demand malgré l’ajustement.

Le vrai enseignement est ailleurs : les ressources cloud ne sont pas infinies et leurs prix ne baisseront pas indéfiniment. Les GPU sont sous tension et le resteront tant que la demande en IA continuera d’exploser. Les entreprises qui optimisent activement leurs architectures et leurs usages seront mieux armées que celles qui comptent sur des baisses de prix automatiques.

Si vous utilisez des charges ML intensives sur AWS ou si vous voulez comprendre comment optimiser vos coûts cloud, contactez-nous pour un audit gratuit de votre infrastructure. Nous vous aiderons à identifier les leviers d’optimisation adaptés à votre contexte, sans langue de bois sur ce qui fonctionne vraiment.

AWS augmente ses prix de 15% ? Non, c'est plus compliqué que ça

Ce que sont vraiment les Capacity Blocks

Une tarification dynamique annoncée dès le départ

Ce qui n’a pas changé

Pourquoi les GPU sont sous tension

Le vrai sujet : la prévisibilité des coûts cloud

Ce qu’il faut retenir

Questions fréquentes

Articles similaires

AWS Lambda : 10 cas d'usage concrets pour automatiser votre entreprise

Le Well-Architected Framework expliqué aux dirigeants

Amazon CloudWatch : surveiller votre infrastructure AWS efficacement

AWS Cost Anomaly Detection : détecter les dépenses inhabituelles automatiquement

Serverless sur AWS : pourquoi les PME s'y mettent

Reprise après sinistre sur AWS : stratégies pour les PME