Gmail, le service de messagerie en ligne de Google, est resté inaccessible près de deux heures hier soir, mardi 1er septembre, aux alentours de 22 heures, heure de Paris. L'ensemble des utilisateurs du monde entier, qu'ils soient individuels ou en entreprise, ont été affectés. Sur son site Google Apps Status Dashboard, Google a confirmé la panne, et a déclaré avoir résolu le problème à 23h40. « Pendant la durée du problème, les utilisateurs pouvaient continuer à envoyer et à recevoir des messages en utilisant POP et IMAP," explique néanmoins un porte-parole de l'entreprise. (Mise à jour)Ben Treynor, VP de l'ingénierie et de la disponibilité du site, explique dans un billet de blog que l'entreprise a déconnecté hier une petite fraction de serveurs Gmail, une habitude destinée à exécuter certaines mises à jour. Ces opérations doivent normalement être transparentes, puisque le trafic est tout simplement déporté vers d'autres machines. Une saturation en chaîne des routeurs de requêtes « Mais nous avions sous-estimé la charge de certaines modifications récentes (ironiquement, destinées à améliorer la disponibilité) sur les routeurs de requêtes qui dirigent ces dernières vers le serveur Gmail approprié pour la réponse, détaille Ben Treynor. Vers 12h30, heure du Pacifique, quelques un de ces routeurs ont été surchargés et ont demandé au reste du système d'arrêter de leur envoyer du trafic parce qu'ils fonctionnaient au ralenti. » Puis ce fut la réaction en chaîne. Le trafic redirigé vers d'autres routeurs a provoqué le même type de blocage et de reroutage. Finalement, quasiment l'ensemble des routeurs s'est retrouvé saturé. Mais seule l'interface Web était affectée, les accès IMAP/POP et le traitement des mails passant par d'autres routeurs. L'alerte a été identifiée très rapidement, et « un très grand nombre de routeurs a été ajouté. » Google promet justement d'installer de façon permanente une quantité plus importante de routeurs. Mais il assure aussi qu'il va mieux gérer la contamination de ce genre de problème entre ces différents centres serveurs. « Un problème sur un de nos datacenters ne devrait pas affecter les serveurs d'un autre, confirme Ben Treynor sur le blog Google. Des routeurs surchargés devraient accepter de fonctionner au ralenti, et non pas refuser tout trafic supplémentaire. » Gmail avait par ailleurs déjà fait l'objet de problèmes lundi 31 août, qui n'avaient apparemment pas totalement été résolus au moment de la deuxième panne. Des utilisateurs individuels et professionnels indifférenciés