Un signal ou un simple ajustement ? La question se pose après la découverte par The Register d’une augmentation des tarifs des instances EC2 pour le machine learning d’AWS. Le fournisseur a procédé à cette évolution discrètement samedi dernier et concerne les instances dites de capacity block où les GPU sont réservés à l’avance pour une certaine durée à un tarif fixe. Un service apprécié des entreprises pour leur projets IA.
Dans le détail, les hausses sont d’environ 15 %. Ainsi, l'instance p5e.48xlarge comprenant huit accélérateurs Nvidia H200 a vu son prix passer de 34,61 $ à 39,80 $ HT l'heure dans la plupart des régions. Les clients de la région Ouest des Etats-Unis (Californie du Nord) ont subi une hausse plus importante, la tarif de l’instance p5e.48xlarge passant de 43,26 $ à 49,75 $ HT.
La région de Californie du Nord subit une hausse plus importante que les autres régions. (Crédit AWS)
Un ajustement en fonction de l’offre et la demande
Interrogé sur les raisons de cette inflation, un porte-parole du fournisseur a indiqué, « le prix des Capacity Blocks EC2 pour le machine learning varie en fonction de l'offre et de la demande, comme décrit sur la page produit. Cet ajustement tarifaire reflète les tendances que nous anticipons pour ce trimestre. » A noter qu'en juin dernier, AWS avait annoncé une baisse de pris de certaines instances EC2 basées les GPU Nvidia pour les plans On Demand et Saving Plan. L'objectif était alors de concurrencer les offres similaires sur Azure ou Google Cloud.
Cette hausse des tarifs des instances GPU montre la tension sur l’approvisionnement en accélérateur notamment Nvidia avec comme conséquence des composants plus chers. De son côté la demande des entreprises pour développer leur stratégie IA continue de croître. L'inflation sur les instances GPU est peut-être un signe avant-coureur pour d’autres augmentations. La pénurie de mémoire font grimper les prix et il est probable que les fournisseurs de cloud les répercuteront à un moment sur les tarifs des instances. La vigilance est donc de mise en ce début d’année pour les équipes IT et FinOps notamment.