Avec l’évolution du rôle des devops, l’accélération dans la modernisation des applications et dans la consommation des services numériques par les clients, Splunk est monté en puissance dans ses solutions d’observabilité. Jusqu’à présent, les outils sur lesquels s’appuyaient les équipes IT et devops pour surveiller les applications et l’infrastructure étaient séparées entre plusieurs plateformes. Mais avec la transition massive vers le cloud et les containers, ces équipes sont maintenant aux prises avec une complexité opérationnelle qui demande de nouveaux outils, connectés entre eux. Le spécialiste de l'analyse des données machine a donc complété ses briques pour constituer sa propre plateforme où collecter l’ensemble des données et couvrir les trois piliers du domaine : les métriques pour détecter les problèmes, les traces pour déterminer où se trouve le problème et les logs pour comprendre dans le détail pourquoi cela s’est produit. La suite Observability Cloud qu’il vient d’annoncer rassemble ainsi des solutions de surveillance des infrastructures, de gestion des performances applicatives, de monitoring des utilisateurs en temps réel et de monitoring synthétique (approche proactive), d’investigation des logs et de réponse aux incidents. L’ensemble apporte aux équipes informatiques et devops une visibilité complète sur le fonctionnement des infrastructures et des applications.

Au total, six produits réunis au sein d’une suite logicielle, accessibles à partir d’une interface unifiée et qui restent parallèlement disponibles de façon indépendante : Splunk APM, Infrastructure monitoring, Log Observer, Synthetics et RUM auxquels s’ajoute On-call, l’outil de gestion des processus d’escalade et de travail collaboratif. « L’observabilité, c’est un problème de données qu’il faut collecter de manière différente, nous sommes dans des environnements cloud, il faut donc les visualiser et faire l’alerting en temps réel pour ensuite pouvoir faire de l’automatisation en temps réel, pour que toute la chaîne puisse fonctionner et qu’il n’y ait pas de goulet d’étranglement », rappelle Stéphane Estevez, directeur du marketing produit pour la zone EMEA chez Splunk. Et il faut évidemment des capacités de mise à l’échelle « dans ces environnements très distribués, avec des métadonnées associées à tous les microservices et une cardinalité infinie », ajoute-t-il.

Les logiciels de l'offre SaaS Cloud Observability restent disponibles en produits stand alone. (Crédit : Splunk) 

Full fidelity avec Splunk APM

Pour constituer cette chaîne de bout en bout, entre 2019 et 2020, Splunk a complété ses technologies sur la gestion des performances applicatives avec l’acquisition de Signal FX (devenu Splunk APM). Il a également racheté Omnition, axé sur le tracing distribué dans le monitoring des architectures micro-services, puis Plumbr dans le Real user monitoring (RUM) et Rigor sur la surveillance de l’expérience numérique.

Le schéma d'observabilité se crée automatiquement au sein de la suite Observability Cloud et l'utilisateur découvre les services sur l'ensemble de la chaîne. Ci-dessus, dans Splunk APM. (Crédit : Splunk)

L’éditeur met en avant des points forts de son offre, par exemple sur sa solution d’APM. Par rapport à l’approche traditionnelle basée sur de l’échantillonnage de transactions, Splunk APM apporte le « full fidelity ». La solution ingère l’ensemble des traces applicatives avec une analyse en continu et en temps réel des données. « Aujourd’hui pour la plupart des entreprises, 55% des transactions sont faites en ligne, il faut trouver le problème au niveau de l’utilisateur final. Donc, ne plus faire de sampling mais avoir toutes les traces de chaque utilisateur, sur chaque micro service, chaque container ou chaque fonction ».

Dernier venu, Synthetic Monitoring, connecté aux autres logiciels, mesure la disponibilité des API et des services ainsi que la santé des services back-end et de l'infrastructure sous-jacente. (Crédit : Splunk)

Principal contributeur du projet OpenTelemetry

Pour collecter les traces, logs et métriques, il y a souvent trois agents différents. Désormais, « un standard de facto commence à prendre le dessus sur le marché des devops, c’est OpenTelemetry », souligne Stéphane Estevez. « Il présente l’intérêt de regrouper la collecte des logs, des métriques et des traces par le même agent qui est beaucoup plus léger et qui permet de les envoyer à Splunk ou à d’autres logiciels ». Avec le rachat d’Omnition, membre fondateur du projet OpenTelemetry, Splunk est devenu son principal contributeur. « Nous avons changé notre manière de présenter les logs aux développeurs », indique le directeur marketing produit EMEA. Avec la suite Observability Cloud, l’installation d’OpenTelemetry permet d’envoyer immédiatement les données dans la solution SaaS en accédant à l’ensemble des logiciels, APM, RUM, infrastructure, etc. pour faire de l’observabilité complète de bout en bout. On peut ainsi démarrer d'un problème sur une transaction utilisateur, avoir directement les traces associées et, à partir des traces, aller dans les logs où le contexte est transmis automatiquement de manière transparente et graphique.

La suite Observability Cloud est disponible pour l’instant depuis les datacenters américains de Splunk. Les services sont en cours de déploiement dans les datacenters en Europe, en commençant par Dublin. L’éditeur travaille principalement avec AWS et GCP. La tarification a également été simplifiée. Auparavant basée sur la volumétrie, elle se fait maintenant au nombre de serveurs observés.