La Ligue majeure de baseball (LMB) – ou, en anglais, Major League Baseball, MLB – fait passer la visibilité du réseau au niveau supérieur. « Aucun système moderne de gestion de réseau n’avait été mis en place avant mon arrivée. Toutes les configurations étaient très artisanales », raconte Jeremy Schulman, qui a rejoint la MLB il y a deux ans en tant qu'ingénieur logiciel principal chargé de l'automatisation du réseau. Les anciens systèmes, notamment le logiciel de supervision PRTG Network Monitor pour faire de la surveillance basée sur le protocole SNMP et les outils de gestion discrets des fournisseurs de réseaux, permettaient à la Major League Baseball de collecter des données à partir des commutateurs et des routeurs, et de suivre, par exemple, certains paramètres comme l'utilisation de la bande passante. Mais ces outils disparates étaient cloisonnés et n'offraient pas de visibilité complète. « Dans nos stades, nous pouvions voir comment était utilisée la bande passante, du point de vue du flux de trafic, sur nos circuits. Nous pouvons savoir de manière très précise la quantité de données transmises entre le stade et nos datacenters, mais nous ne pouvons avoir d’aperçu sur les utilisateurs du trafic, par exemple, savoir la quantité de bande passante utilisée par les caméras vidéo, par rapport au trafic des téléphones VoIP ou d'autres aspects de l'infrastructure du stade », précise M. Schulman.

Déploiement de la plateforme d’analyse Kentik

Pour avoir une meilleure visibilité sur ses réseaux, la MLB a déployé la plateforme d'analyse des flux réseau de Kentik. Conçue pour unifier divers flux de données de surveillance à travers les clouds, les datacenters, la périphérie, le SaaS et le WAN, cette plateforme prend en charge de nombreux formats de télémétrie, ce qui est essentiel pour la Major League Baseball compte tenu de son environnement réseau multifournisseur qui fonctionne avec des matériels de Cisco, Arista et Extreme Networks. Cet environnement de réseau complexe est utilisé par trente équipes à travers les Etats-Unis et le Canada. La ligue exploite ses propres datacenters et elle maintient des environnements de campus traditionnels dans les bureaux de la MLB, notamment dans son centre de replay installé dans le Rockefeller Center à New York, où les jeux, soumis à un replay instantané, sont analysés en utilisant le flux de caméras de télévision à haute fréquence d'images.

Les stades fonctionnent comme des mini datacenters de périphérie, et disposent de l’infrastructure pour gérer un grand nombre d'applications, notamment la VoIP, les transactions commerciales et les appareils mobiles, dans les abris et les bulles qui diffusent des vidéos pendant le match. Les stades se connectent à Internet via des circuits MPLS. La Major League Baseball fournit également des services WiFi pour les supporters dans certains stades et diffuse des vidéos sur un réseau multicast. « Nous avons des réseaux de campus, des réseaux étendus, des réseaux sans fil, des réseaux de datacenters, des réseaux MPLS », présente M. Schulman. « De plus, nous utilisons un réseau multicast pour acheminer nos flux vidéo vers tous les stades. Ainsi, en plus de toute l'infrastructure elle-même, nous disposons d’un ensemble très sophistiqué de services réseau que nous déployons. »

Mieux surveiller les ressources cloud

La Ligue majeure de baseball exploite également des charges de travail dans le cloud, notamment des plateformes de jeux pour les fans et un système de suivi des statistiques appelé Statcast. Pour maîtriser cet ensemble, la plateforme Kentik collecte les données de trafic et la télémétrie – y compris des mesures au niveau des appareils, des données de performance, des détails de configuration, le routage et les processus d'orchestration – à partir des appareils réseau de la Major League Baseball, comme les routeurs, les commutateurs et les points d'accès sans fil. Sur le plan de l'analyse, la plateforme fournit des informations qui aident les équipes réseau de la MLB à rationaliser l'analyse des causes profondes et la planification des capacités.

Appelée Kentik Network Observability Cloud, la plateforme est fournie sous forme de service et sous licence par dispositif, et elle collecte, stocke et analyse les données du réseau sur sa propre infrastructure, que la MLB a construite et exploite dans un datacenter en location. Une installation de cette envergure permet aux utilisateurs d'accéder à des ensembles de données plus importants, conservés pendant de plus longues périodes, ce que ne permettrait pas une capacité sur site classique. Le fait de disposer d'une telle profondeur de données collectées renforce à son tour les capacités analytiques de la plateforme. Kentik propose des visualisations préétablies, souvent organisées autour des fonctions IT, pour optimiser par exemple l'acheminement du trafic réseau ou détecter les attaques DDoS. Cette configuration est essentielle pour l’organisation sportive. « Ce qui nous a séduits chez Kentik, c'est que sa solution est en mode SaaS. Cela signifie que nous n’avons pas à gérer et ni à déployer une infrastructure sur site pour étendre la collecte de flux. Je ne voulais pas acheter un produit qui m'obligerait à monter des serveurs et à les équilibrer en termes de charge », ajoute M. Schulman.

Une architecture multicloud

La visibilité sur les réseaux des fournisseurs de cloud était une autre exigence de la MLB. La technologie Kentik peut ingérer des données de flux à partir d’AWS, de Google Cloud, d’IBM Cloud et de Microsoft Azure. Les utilisateurs peuvent explorer le trafic vers, depuis, dans et entre les fournisseurs de cloud, les régions, les zones de disponibilité, les VPC, les sous-réseaux et les instances, et le système peut présenter des ventilations du trafic par application, adresse IP et attributs commerciaux. « Il ne s'agit donc pas seulement de montrer le volume de trafic entrant et sortant de ces différents projets dans le cloud. Nous obtenons une représentation visuelle de la façon dont l’équipement physique se connecte via ces connexions privées virtuelles dans le cloud », souligne M. Schulman. « Nous avons également des informations sur la latence, le débit et la gigue, sur site, dans le cloud et le retour sur site. C'était important pour nous d’avoir une visibilité sur notre trafic, non seulement à partir de notre infrastructure réseau multifournisseur, mais aussi quand le trafic transite par notre infrastructure cloud, où sont exécutées la plupart de nos applications de baseball. »

Cette visibilité est un besoin commun à toutes les équipes IT d’entreprise. De façon générale, ces équipes ont du mal à conserver une visibilité sur les réseaux et les systèmes à mesure que les environnements IT deviennent plus complexes. En particulier, les réseaux hybrides mettent à rude épreuve les outils existants qui ne sont pas conçus pour surveiller et analyser les interactions entre les infrastructures sur site et dans le cloud. Selon Gartner, du fait de l'impact des réseaux hybrides, d'ici 2024, 50 % des équipes d'exploitation de réseau devront réarchitecturer leur pile de surveillance réseau, contre 20 % en 2019. Une meilleure visibilité permet aux équipes réseau de gagner en efficacité et de résoudre plus rapidement les problèmes. Plus largement, dans la sphère IT, l'observabilité au niveau de la couche réseau est souvent absente des frameworks de surveillance et d'analyse des applications d'entreprise. En comblant ces lacunes en matière de visibilité, il est possible de mettre en œuvre des capacités de plus haut niveau, par exemple, en corrélant les données du réseau avec celles d'autres systèmes de veille stratégique et d'analyse prédictive.

Faire passer l'analyse réseau du stade tactique au stade stratégique

Les premiers projets de la Major League Baseball utilisant les capacités de surveillance et d'analyse de Kentik ont porté sur la distribution du trafic, la fiabilité du réseau et l'expérience de l'utilisateur final. L’an dernier, pendant la saison morte, la MLB a utilisé la plateforme Kentik pour consolider des datacenters. « Le logiciel Kentik nous a permis de surveiller le trafic dans le datacenter que nous voulions mettre hors service, afin de savoir qui utilisait encore ce datacenter », explique M. Schulman. La technologie de la plateforme permet d’analyser les données d'application et d’usage et de fournir une vision plus claire du trafic du datacenter. La MLB a pu ainsi identifier les propriétaires d'applications qui devaient relocaliser leurs applications avant que la Major League Baseball ne consolide les charges de travail de son datacenter et ne mette hors service l'une de ses propriétés.

En cours de saison, la Ligue majeure de baseball s'appuie sur la surveillance et l'analyse du réseau pour repérer les anomalies et les comportements inhabituels. La plateforme Kentik lui permet de visualiser les flux de trafic critiques pendant la saison, et d'analyser plus rapidement la cause profonde des problèmes. « Par exemple, nous pouvons voir nos flux vidéo multicast. Kentik peut en effet décomposer l'analyse du flux de trafic et nous montrer les données de chaque flux provenant des caméras », affirme M. Schulman. En cas de problème avec le flux d'une caméra, Kentik permet de déterminer plus facilement s'il s'agit d'une défaillance du dispositif ou d'une question de performance du réseau, et grâce à cette analyse, il est possible de résoudre le problème en quelques minutes au lieu de plusieurs heures. Pour l'instant, Kentik est un outil tactique, mais la Major League Baseball utilise également la plateforme pour être plus proactive à mesure qu'elle développe ses capacités d'observation plus larges. C'est un travail en cours, et M. Schulman est optimiste quant aux apports futurs de la technologie.

Voir les analyses du réseau dans leur contexte

Alors que l'équipe réseau a étendu son usage de la technologie Kentik, la Major League Baseball cherche à en tirer bénéfice en dehors des opérations réseau. L'objectif est de permettre aux utilisateurs de corréler les données du réseau avec d'autres sources de gestion des performances et d'analyse prédictive. Pour ce faire, la MLB a mis en place une plateforme de surveillance et d'analyse à l'échelle de la ligue qui couvre plusieurs domaines IT : applications, infrastructure des systèmes, infrastructure du cloud et infrastructure du réseau. Créée par l'équipe de développement logiciel pour surveiller les performances des applications, cette plateforme repose sur la technologie de surveillance et d'analyse de Circonus, complétée par des produits commerciaux, des logiciels open source et des capacités développées sur mesure. Désormais, les données et les informations recueillies par Kentik seront ajoutées à ce mix (Kentik comporte une API et une solution pour extraire des données et générer des visualisations dans d'autres tableaux de bord). « Toutes ces informations très riches sont placées sur une plateforme d'observabilité commune, ce qui démocratise les données d'une manière très importante pour la MLB », confirme M. Schulman.

Selon M. Schulman, le fait de permettre à d'autres disciplines IT d'accéder aux données du réseau pourrait accélérer le dépannage et améliorer les performances. « Cela signifie que quand une personne de l'équipe systèmes essaie de dépanner ou de diagnostiquer quelque chose, elle n'a pas besoin d'envoyer un courriel à l'équipe réseau pour lui demander à quoi ressemble la bande passante sur tel port, sur telle interface. L’équipe systèmes peut simplement extraire les données de la plateforme d'observabilité. C’est un formidable outil global de mesure, très approfondi et riche, et très transversal. » M. Schulman estime qu’il est incroyable d'avoir un tel outil à disposition : « Nous n'avons pas à prendre de décisions isolées concernant les outils. Nous pouvons travailler avec un groupe d'ingénieurs très sophistiqués à travers tous ces autres domaines de l'infrastructure cloud, de l'infrastructure systèmes, et nous pouvons utiliser leurs outils, ainsi que leur technologie. Nous apportons simplement nos données, et tout le monde y a accès. Je ne sais pas combien d'entreprises font ce que nous faisons. Je pense que c'est vraiment unique. »

Abandonner les produits de gestion du réseau SNMP hérités et s'impliquer dans un effort de gestion plus stratégique et interéquipes est l’un des objectifs de M. Schulman. Ce dernier a une formation en génie logiciel et il a passé la dernière décennie à explorer le potentiel de l'automatisation des réseaux. « Si j'ai accepté un poste à la Major League Baseball, c'est parce que tous ses dirigeants reconnaissent que l'automatisation du réseau doit être une technologie de base pour l'avenir », avoue M. Schulman. « C’est pour cette raison que j’ai rejoint l'équipe chargée de l'infrastructure réseau : pour faire avancer cette technologie et faire évoluer notre infrastructure réseau de manière à ce qu'elle soit aussi agile que ce que nous promettent les spécialistes du cloud et des serveurs. »