Cette semaine, les clients d'Amazon Web Services ont fait part de leurs inquiétudes à propos du redémarrage que le fournisseur réalise sur ses serveurs. Mais, selon les experts, « si les utilisateurs ont correctement configuré leurs applications, ils ne devraient pas souffrir de l'opération de maintenance. »

Amazon a adressé à ses clients AWS un courriel les informant que les serveurs qu'ils utilisent seront redémarrés au motif qu'ils doivent « recevoir des patchs de mises à jour, » comme l'indique le communiqué publié en ligne par Randy Bias, directeur technique de Cloudscaling. Cette nouvelle a mis certains utilisateurs en ébullition, qui s'inquiétaient de savoir si leurs applications seraient toujours accessibles pendant le redémarrage. « Apparemment, aujourd'hui mercredi, c'est le reboot de l'EC2. C'est aussi le jour où certains PDG apprennent : (1) qu'ils utilisent l'EC2 ; (2) qu'ils ne l'utilisent pas très bien, » écrit sur Twitter William Vambenepe, architecte logiciel chez Oracle. EC2 - pour Elastic Compute Cloud - est une offre d'Amazon Web Service (AWS) qui permet aux entreprises de louer des serveurs sur lesquels elles peuvent faire tourner leurs propres applications web.

Le reboot d'un cloud n'est pas incongru

D'autres experts, ainsi qu'Amazon, ont rappelé aux utilisateurs que le redémarrage n'est pas quelque chose de nouveau ou exclusivement le fait de services cloud. « Ce calendrier de déploiement correspond à peu de choses près au calendrier de maintenance des fournisseurs de services d'hébergement traditionnels ou à celui réalisé en interne par les groupes informatiques quand ils déploient des correctifs logiciels ou des mises à jour, » explique Kay Kinton, une porte-parole d'Amazon.

GoGrid, un fournisseur d'Infrastructure-as-a-Service (IaaS), fait également remarquer que si les entreprises gèrent leurs propres serveurs en interne, ils doivent faire des mises à jour similaires. Certes, le déplacement vers le cloud évite aux administrateurs de nombreux soucis de gestion globale, mais certains ont pu considérer que les problèmes liés au redémarrage nécessaire de ces serveurs « appartenaient au passé depuis qu'ils avaient rejoint le cloud,» a ajouté Jayson Vantuyl, ingénieur en chef chez GoGrid. Autre exemple, Salesforce propose une mise à jour trimestrielle, généralement effectuée le dimanche matin, qui immobilise pendant une courte durée ses solutions en ligne.

Penser à la redondance même sur le cloud

« Les utilisateurs qui ont préparé leurs systèmes de façon à inclure les redondances ne devraient pas avoir de problème, » a-t-il ajouté. « Si vous n'avez pas de redondance, vous vous retrouvez où vous étiez déjà, » a-t-il expliqué. Il entend par là qu'Amazon - ou tout autre fournisseur de cloud - ne garantit jamais que le matériel ne tombera pas en panne. « Si un utilisateur ne dispose pas de redondance intégrée dans son application et qu'un élément de hardware devient indisponible pour une raison quelconque, leur application en subira les conséquences. » Amazon prévient les utilisateurs dans le cas où leurs applications risquent d'être impactées, afin qu'ils aient la possibilité de gérer le redémarrage eux-mêmes.

« Netflix, qui gère son service de vidéo en streaming sur AWS, a opté pour un reboot calé sur son propre calendrier, » a écrit sur Twitter Adrian Cockcroft, directeur de l'architecture systèmes dans le cloud chez Netflix. « Cela permet aux utilisateurs de s'assurer que, à aucun moment, leur cluster tout entier ne se retrouve hors ligne, » a déclaré Mark Worsey, DSI de GoGrid. « Ils peuvent le faire eux-mêmes très méthodiquement, » a-t-il ajouté. «  AWS laisse le choix à l'entreprise de réaliser cette opération de manière contrôlée afin d'éviter le grand reboot massif qui engendre une panne, » a-t-il expliqué.

Un redémarrage zone géographique après l'autre

Néanmoins, Amazon prend soin de réaliser son opération de mise à jour zone par zone. « Nous prenons garde de ne pas effectuer les mises à jour sur des zones de disponibilité multiples, dans la même région, le même jour, de façon à ce que les instances d'un client situées dans des zones de disponibilité différentes ne soient pas mises à jour au même moment, » a déclaré la porte-parole d'Amazon. Cela signifie que le client qui a anticipé le basculement de ses applications dans une autre région ne sera pas touché par le redémarrage.