La foudre a provoqué une panne d'électricité dans des datacenters appartenant à Amazon et Microsoft, dimanche à Dublin (Irlande) provoquant des interruptions dans les services cloud proposés par ces deux fournisseurs. La foudre a frappé un transformateur, déclenchant une explosion et un feu qui a provoqué la panne, selon les explications communiquées par Amazon à 10 :41 AM PDT (Pacific Daylight Time) dans son tableau de bord renseignant sur l'état de son service (http://status.aws.amazon.com/). En situation normale, les générateurs de secours se seraient mis en route sans que l'on s'en aperçoive, mais l'explosion a également endommagé certains de ces dispositifs.

A 1:56 PM PDT, le courant avait été rétabli sur la plupart des équipements du réseau, ce qui a permis à Amazon de se concentrer sur la remise en service des instances de son cloud EC2 (Elastic Compute Cloud) et des volumes de son service de stockage EBS (Elastic Block Storage). Mais le fournisseur a reconnu deux heures plus tard qu'il ne l'avait pas fait aussi vite que prévu. « En raison de l'importance de la panne de courant, un grand nombre de serveurs EBS ont nécessité des interventions manuelles avant que les volumes puissent être restaurés... ». Même si un grand nombre de ces volumes devaient être restaurés au cours des heures suivantes, le fournisseur s'attendait à ce que l'ensemble du processus prenne 24 à 48 heures. Pour l'accélérer, Amazon a commencé à ajouter davantage de capacités EBS.

Du côté de Microsoft, ce sont les clients européens de la suite de productivité BPOS qui ont été affectés par la panne d'électricité. Mais les services ont été rétablis pour tous les utilisateurs à 5:45 PM PDT, a précisé par e-mail un porte-parole de la société à nos confrères d'IDG News Service.

Les convaincus du cloud public ne s'inquiètent pas

La société néerlandaise Layar, dont la plateforme de réalité augmentée tourne sur le cloud d'Amazon depuis 18 mois, compte parmi les clients touchés par l'interruption. « J'ai suivi sans interruption #AWS sur Twitter et consulté nos tableaux de bord AWS. C'était frustrant. Il n'y avait rien d'autre à faire qu'attendre, a confié Dirk Groten, directeur technique de Layar, sur un billet posté autour de minuit entre dimanche et lundi, heure locale.

Contacté lundi matin par IDG News Service, Dirk Groten a indiqué que son service était reparti et qu'il restait convaincu par les services cloud. N'importe quel datacenter peut être interrompu à la suite d'une panne d'électricité. Il était évident qu'Amazon travaillait d'arrache-pied pour restaurer le service, mais les informations que l'hébergeur fournissait ne correspondaent pas toujours avec ce que constatait réellement Layar, a néanmoins admis Dirk Groten. Il a ajouté qu'il attendait qu'Amazon publie un rapport définitif sur l'incident, en incluant ce qu'il prévoyait de faire à l'avenir pour prévenir que des problèmes similaires se produisent de nouveau.

D'autres problèmes de connectivité sur EC2 ont été communiqués lundi soir 8 août, aux Etats-Unis cette fois, dans le nord de la Virginie, suspendant temporairement différents sites web et services utilisant l'infrastructure de cloud AWS (Amazon Web Services). L'incident, qui n'aurait pas excédé une trentaine de minutes, illustre néanmoins l'un des risques du modèle, évoqué par les détracteurs du cloud public qui souhaitent conserver la maîtrise de l'infrastructure. En avril dernier, déjà, Amazon a dû faire face à une interruption de service qui a perturbé certains services, parmi ses clients (aux Etats-Unis, en particulier, mais pas seulement -EC2 compte également des utilisateurs en France, notamment).


Illustration : le service Health Dashboard d'AWS (crédit Amazon)