Les entreprises ne se contentent pas de migrer leurs applications vers le cloud. Elles y transfèrent le réseau lui-même. De plus en plus d’entreprises ferment leurs centres de données et migrent leur infrastructure réseau directement vers le cloud. Les sessions Border Gateway Protocol (BGP), les pare-feux virtuels, les passerelles de transit et les terminaisons VPN suivent le calcul. Le défi pour de nombreuses entreprises consiste à disposer d'une observabilité adéquate à la fois sur les réseaux sur site et les réseaux multicloud. C'est le défi que l'éditeur Selector s’attache désormais à relever avec la mise à jour de sa plateforme NetOps publiée cette semaine. Les dernières fonctionnalités apportent aux équipes réseau une vue unique et corrélée sur l’ensemble des succursales, des installations de colocation, des centres de données sur site et de l’infrastructure de cloud public. « Les entreprises ont besoin du même niveau de détail, d’AIOps et d’observabilité pour leurs structures réseau dans le cloud que celui dont elles disposaient pour leur centre de données, en connexion avec leurs succursales », a déclaré Kannan Kothandaraman, cofondateur et CEO de Selector, qui avait accéléré le développement de sa plateforme avec une levée de fonds de 33 M$.

Selon le fournisseur, ces fonctions multicloud sont une extension de sa plateforme existante, et non un produit distinct. L'objectif est de permettre aux équipes réseau de tracer un problème de connectivité sur l'ensemble du chemin hybride sans avoir à changer d'outil ni de contexte. Ce chemin peut passer par un fournisseur SD-Wan, une liaison d'un fournisseur de services, une interconnexion de colocation, une passerelle Direct Connect et une passerelle de transit VPC avant d'atteindre une application hébergée dans le cloud. M. Kothandaraman pense que la plupart des outils de gestion de la performance des applications (application performance monitoring, APM) n’approfondissent pas suffisamment l’analyse du chemin réseau pour couvrir ce traçage de bout en bout. Les premiers déploiements ont mis en évidence des problèmes qui n’étaient pas visibles auparavant. Lors d’un examen de migration, M. Kothandaraman a indiqué que la plateforme avait révélé un flux d’application dont le client ignorait l’existence. « Si les succursales se plaignent de ne pas pouvoir accéder à une application, il faut savoir si le problème vient du SD-Wan, du circuit de fournisseur de services, des passerelles Direct Connect Equinix, ou des passerelles de transit VPC », a demandé M. Kothandaraman. « Il faut pouvoir relier tout cela pour y répondre. C’est la solution que nous avons mise au point ici. »

Un hyperviseur de données doté d'une fonction VRF

L’approche de Selector repose sur une couche de normalisation que l’entreprise appelle hyperviseur de données. Celle-ci se situe entre la couche d’ingestion de télémétrie et les moteurs d’IA et de ML situés au-dessus. Sa fonction est de rendre les données entrantes indépendantes de leur source avant qu’elles n’atteignent la couche d’analyse, quelle que soit leur provenance. Dans les environnements cloud, l'ingestion s'effectue principalement via des API. La plateforme collecte les journaux de flux VPC et s'abonne aux flux d'événements des hyperscalers pour obtenir les données relatives aux modifications de l'infrastructure. Elle récupère également des données de télémétrie provenant d'outils tiers, notamment des pare-feux virtuels et des équilibreurs de charge. Côté on premises, le protocole Simple Network Management Protocol (SNMP) et la télémétrie en continu restent d'actualité. Les constructions cloud-native couvertes incluent les passerelles de transit AWS, les passerelles Direct Connect et les routeurs Google Cloud. La plateforme gère aussi la fonction de routage et de transfert virtuels VRF (virtual routing and forwarding) et les configurations border gateway protocol (BGP) au sein des environnements cloud. Une fonctionnalité spécifique au cloud consiste à suivre les changements du côté des hyperscalers. Les entreprises ne contrôlent pas l’infrastructure physique sous-jacente. Lorsqu’un hyperscaler publie un événement de changement, la plateforme le met en corrélation avec le comportement réseau observé afin de déterminer s’il provoque un problème du côté du client. M. Kothandaraman fait remarquer que la télémétrie cloud s'est avérée plus simple à normaliser que les données sur site. Les environnements sur site présentent des variations importantes dans les formats de données des fournisseurs. Dans les environnements cloud, les hyperscalers publient des données d'événements structurées que la plateforme peut exploiter de manière cohérente.

L'hyperviseur de données qui harmonise les données de télémétrie entre les environnements sur site et dans le cloud constitue également la base sur laquelle Selector construit sa prochaine couche. Depuis sa création, l'entreprise développe des modèles d'IA de fondation pour les infrastructures réseau, et elle a récemment intégré l'IA générative à l'ensemble de son produit. Dans un premier temps, l'accent a été mis sur la couche dédiée à l'expérience utilisateur. M. Kothandaraman a précisé que l'entreprise avait adopté une approche réfléchie, consistant à construire d'abord des modèles d'infrastructure de fondation, puis à y superposer l'IA générative. Une version complète de l'IA générative couvrant l'ensemble de la plateforme est prévue pour l'automne. « Lors de notre lancement majeur prévu à l'automne, nous dévoilerons une solution complète basée sur l'IA générative côté produit. Ce que l'on peut faire est étonnant ! », a-t-il affirmé