Jusqu'à récemment, les bureaux que possédait Condé Nast, l'éditeur centenaire de Vogue et de Vanity Fair, dans chaque pays, fonctionnaient de manière indépendante, aussi bien sur le plan commercial que pour la gestion des processus et des workflows. Mais sous l’impulsion de Condé Nast International, l’entité qui s'occupe des bureaux localisés en dehors de l’Amérique du Nord, l'entreprise s’est tournée vers PagerDuty et sa plateforme cloud de réponse aux incidents et de visibilité pour aider le groupe d’édition à se prémunir contre les pannes coûteuses.

Il y a quelques années, Condé Nast International a décidé de construire une plate-forme technologique unifiée qu’elle pourrait déployer dans le monde entier afin de moderniser tous les pays en propriété exclusive (et les pays licenciés) en même temps. « Nous voulions développer cette nouvelle plate-forme, essentiellement en Node.js et React JavaScript dans AWS », a expliqué Crystal Hirschorn, directrice de l'ingénierie et de l'infrastructure cloud chez Condé Nast. « Si nous avons commencé à utiliser PagerDuty, c'est parce que, avec cette plate-forme, nous lançons également 60 sites Web sur ces marchés et ces marques. Et mieux encore, elle va nous permettre d’intégrer davantage de produits de type SaaS et de construire davantage de produits sur la plateforme ».

VictorOps vs PagerDuty 

Crystal Hirschorn, ingénieure logiciel depuis 15 ans, avait précédemment travaillé avec PagerDuty à la BBC. Celle-ci a expliqué que lorsque Condé Nast International cherchait une solution de visibilité et de workflow, le choix était vraiment limité. Et même si l'équipe s’était également intéressée à VictorOps, désormais détenu par Splunk, PagerDuty était clairement la meilleure option, non seulement pour sa technologie, mais aussi à cause de l’affinité que les architectes de l'édition numérique ont avec la plate-forme. Selon Crystal Hirschorn, PagerDuty a été indispensable pour la mise en place d’une ingénierie du chaos dans l’entreprise. « Pour nous, l’essentiel tournait autour de cette ingénierie du chaos, laquelle consiste à simuler des pannes dans différentes parties de notre pile technologique, dans nos couches d'infrastructure, dans nos couches réseau, dans nos couches applicatives, ou dans les couches de diffusion de contenu (CDN). Nous simulons simplement des pannes, et PagerDuty déclenche les bonnes alarmes - uniquement pour tester que les procédures fonctionnent et que les politiques sont correctes ».

Crystal Hirschorn souligne également le choix important et indispensable fait par l'entreprise de passer en open source l’apprentissage à la gestion des incidents. Évidemment, n'importe quelle entreprise peut jeter un œil au matériel, et pas seulement les clients de PagerDuty. Mais selon elle, il est important que cette ressource soit disponible gratuitement. « C'est vraiment une bonne chose, parce que beaucoup d'entreprises ont des difficultés à mettre en place un processus d'intervention en cas d'incident et dans les situations de pannes massives, c'est vraiment la clé », a déclaré Mme Hirschorn. « C'est une excellente chose que PagerDuty livre ce matériel en open source, parce que beaucoup d'entreprises s'intéressent vraiment à la façon dont ce processus est défini dans une entreprise comme PagerDuty, mais aussi parce que beaucoup de gens utilisent cet outil dans leur processus de gestion des incidents ». Ajoutant : « Nous avons tout mis en place pour que tout se passe au mieux au cas où nous devrions affronter une vraie panne de niveau P0 ou P1. C’était vraiment très important pour nous ».

Mieux intégrer les codeurs aux métiers 

La visibilité apportée par PagerDuty permet également d'unifier les équipes travaillant dans les différents départements, de regrouper leurs workflows d'une « manière qui fait sens pour tous » et de renforcer le modèle devops de l'entreprise. « Pour moi, le devops consiste à réunir des gens qui ont de l'expertise en développement, et d’autres qui ont de l'expertise opérationnelle, et à essayer de faire en sorte que ces compétences se chevauchent un peu », a encore déclaré Crystal Hirschorn. « Chaque partie reconnaît que l’autre équipe ne doit pas renoncer à sa spécialité, mais nos équipes de développeurs sont capables d'exploiter ce qu'ils construisent et, de la même façon, nos équipes opérationnelles savent comment fonctionne le développement.

C’est ce travail en commun qui permet d’en arriver là ». Mme Hirschorn ajoute que l’association de nombreux d'outils numériques comme PagerDuty avec DataDog, un fournisseur d'analyse de données basée sur SaaS, a contribué à faciliter le travail des développeurs. « Ils peuvent supprimer les alarmes quand c’est nécessaire, configurer les flux de travail proprement pour dire ensuite si tel système est critique, et si tel autre ne l’est pas, que tel système est en production, que tel autre ne l’est pas », a encore expliqué Crystal Hirschorn.