Les datacenters s'efforcent d'améliorer la résilience de leur infrastructure physique, d'éviter des pannes de plus en plus coûteuses et de recruter du personnel qualifié sur un marché du travail concurrentiel. Voici quelques-uns des faits saillants qui ressortent de la dernière enquête annuelle (12e édition) sur les datacenters de l'Uptime Institute, qui suit les tendances en matière de capacité, d'adoption de technologies et de personnel. Pour cette enquête, 800 propriétaires et exploitants de datacenters ont notamment été interrogés.

Que retenir des principaux enseignements de l'étude ? Tout d'abord, la durée de vie des serveurs augmente, et dépasse désormais souvent les trois à cinq ans prévus par les fournisseurs. Dans l'enquête 2015 d'Uptime, 34 % des personnes interrogées déclaraient avoir maintenu leurs serveurs en activité pendant cinq ans ou plus. En 2022, cette proportion est passée à 52 %. Plusieurs raisons à cela selon le cabinet d'études. La disponibilité des semi-conducteurs est tout d'abord un facteur. Les pénuries de composants ont en effet entraîné des prix plus élevés et des délais de livraison plus longs et « les petites organisations avec moins de pouvoir d'achat ont souvent dû retarder les mises à niveau non essentielles », souligne le rapport. La tendance peut également refléter un ralentissement des gains d'efficacité énergétique des serveurs. Le récent matériel informatique améliore généralement l'efficacité du datacenter, mais Uptime suggère que ces incitations à l'efficacité ralentissent. « Les changements de génération, en particulier dans les serveurs alimentés par Intel, qui constituent la majeure partie du marché, offrent des performances et des améliorations énergétiques beaucoup plus faibles qu'auparavant », écrit Uptime. « L'offre de serveurs plus efficaces utilisant des processeurs alternatifs (basés sur AMD et ARM) est encore limitée ».

Le coût des pannes des datacenters en hausse

Il existe des mesures encourageantes concernant les pannes des datacenters, mais Uptime prévient qu'elles peuvent être mal interprétées. Dans l'ensemble, le cabinet a suivi une amélioration constante du nombre de pannes par site. En 2022, 60 % des opérateurs interrogés déclarent avoir eu une panne au cours des trois dernières années, contre 69 % en 2021 et 78 % en 2020. Autre point positif : moins de responsables ont signalé des pannes sérieuses ou graves dans les datacenters. Historiquement, ces pannes représentent environ 20 % de toutes les pannes, selon Uptime. En 2022, ce chiffre est tombé à 14 %. Malgré un nombre inférieur de pannes par site et des soucis graves moins fréquents, le nombre total des interruptions dans le monde a augmenté d'une année sur l'autre. Point positif : la fréquence des pannes n'a pas augmenté aussi rapidement que l'empreinte mondiale des datacenters. Bien que les métriques relatives aux pannes puissent être difficiles à interpréter, une tendance est claire selon Uptime : les pannes deviennent de plus en plus coûteuses. En particulier, celles coûtant plus d'un million de dollars est en augmentation.

Interrogés sur le coût de leur plus récente panne, 25 % des personnes interrogées ont déclaré qu'une interruption de service leur avait coûté plus d'un million de dollars en coûts directs et indirects, en augmentation significative par rapport à 2021 (+10 points). 45 % des répondants de 2022 ont par ailleurs déclaré que leur dernière panne avait coûté entre 100 000 $ et 1 M$, contre 47 % en 2021. Pourquoi le coût des pannes augmente-t-il ? Le cabinet d'étude attribue cette situation à une variété de facteurs, allant de l'inflation, des amendes, des violations d'accord de niveau de service et du coût de la main-d'œuvre, des appels et des pièces de rechange. Mais la principale raison est la dépendance croissante de l'activité économique des entreprises sur les services numériques et sur les datacenters. La perte d'un service informatique critique se traduit souvent directement et immédiatement par une interruption de l'activité et une perte de revenus.

Les problèmes d'alimentation, principale cause des pannes

Selon Uptime, les problèmes d'alimentation sur site restent la principale cause de pannes importantes sur le site pour 42% des répondants. La deuxième cause citée est relative aux problèmes réseau (14 %). Viennent ensuite les pannes de refroidissement (13 %), les problèmes de systèmes informatiques (13 %) et chez les fournisseurs tiers SaaS, hébergement et cloud (8 %). Il y a aussi des avis mitigés concernant le cloud. D'une part, les entreprises sont de plus en plus confiantes quant à son utilisation pour les workloads critiques. En 2019, 74 % des personnes interrogées ont déclaré qu'elles ne les placeraient pas dans un cloud public. En 2022, ce chiffre est tombé à 63 %. Dans le même temps, la part des répondants qui ont déclaré avoir une visibilité adéquate sur la résilience du service fourni par un cloud public est passé de 14 % à 21 %, rapporte Uptime.

« Les organisations sont de plus en plus confiantes dans l'utilisation du cloud pour les charges de travail critiques, en partie en raison d'une perception d'une meilleure visibilité sur la résilience opérationnelle », a écrit Uptime. Cependant, d'autres données suggèrent que la confiance des utilisateurs du cloud pourrait être mal placée. Le problème, ce sont les zones de disponibilité. Une zone de disponibilité dispose généralement d'une alimentation et d'un réseau redondants, et les fournisseurs de cloud recommandent aux utilisateurs de répartir leurs charges de travail sur plusieurs d'entre elles en cas de panne. Mais les remontées d'indicateurs suggèrent que les entreprises ne le font pas avec autant de diligence qu'elles le devraient. Interrogés sur l'impact potentiel si un fournisseur de cloud principal subissait une panne dans une seule zone de disponibilité, 35 % des répondants ont déclaré que cela entraînerait des problèmes de performances ou des temps d'arrêt importants, et 49 % ont déclaré que des problèmes de performances ou des temps d'arrêt mineurs seraient attendu. « Cela présente une contradiction évidente. Les utilisateurs semblent plus convaincus que le cloud peut gérer des workloads critiques, mais plus d'un tiers des utilisateurs conçoivent des applications vulnérables aux pannes de zone de disponibilité relativement courantes », fait savoir Uptime.

Aggravation des problèmes de recrutement dans les datacenters

Alors que le nombre et la taille des datacenters dans le monde continuent de croître, le nombre d'offres d'emploi augmente également et dépasse les efforts de recrutement, selon Uptime. Il estime que les besoins en personnel augmenteront à l'échelle mondiale, passant d'environ 2 millions d'équivalents temps plein (ETP) en 2019 à près de 2,3 millions en 2025. Certains de ces emplois dans les datacenters appartiennent à de nouvelles catégories et nécessitent des compétences spécialisées. D'après le rapport : « la pénurie de personnel affecte presque tous les rôles professionnels dans les centres de données dans le monde. Sur les marchés matures des datacenters, tels que l'Amérique du Nord et l'Europe de l'Ouest, une grande partie de la main-d'œuvre existante vieillit et de nombreux professionnels s'attendent à prendre leur retraite à peu près au même moment, laissant les datacenters avec un déficit à la fois en termes d'effectifs et d'expérience. Les efforts de recrutement sont souvent compensés par la faible visibilité des demandeurs d'emploi sur le secteur. Les efforts visant à renforcer les viviers de talents en attirant des personnes qui changent de carrière dans cette industrie en sont encore à leurs balbutiements ». Dans l'enquête de 2022, 53 % des opérateurs ont signalé des difficultés à trouver des employés qualifiés en 2022, contre 47 % en 2021 et 38 % en 2018. En outre, 42 % ont signalé des problèmes d'embauche de personnel, dans la plupart des cas chez des concurrents. C'est un bond significatif par rapport à seulement 17% en 2018.

Selon Uptime, la plupart des répondants déclarent qu'ils rendent compte de la consommation d'énergie globale des datacenters et de l'efficacité de l'utilisation de l'énergie (PUE), mais beaucoup ne suivent toujours pas les mesures environnementales critiques. La plupart des opérateurs s'attendent bientôt à être tenus de rendre compte des émissions de carbone par exemple. Mais beaucoup ne sont pas prêts à s'y conformer. Parmi les répondants à l'enquête, 63 % ont déclaré qu'ils pensaient que les autorités de leur région les obligeraient à publier des données environnementales au cours des cinq prochaines années, mais seulement 37 % collectent et déclarent des données sur les émissions de carbone (contre 33 % en 2021). Et 39 % actuellement déclarent leur consommation d'eau (contre 51 % en 2021). De futures lois, normes et exigences obligeront les opérateurs à combler ces lacunes et à établir des pratiques de suivi et de rapport de durabilité plus strictes dans les années à venir, rapporte Uptime.