Présent dans 148 pays via une trentaine d'implantations effectives, Airbus Helicopters est une filiale du groupe Airbus de 20 000 employés réalisant 6 milliards d'euros de chiffre d'affaires. La DSI, qui comprend 250 collaborateurs, gère un parc de 450 applications sur lesquelles 800 évolutions sont opérées chaque mois. Ce parc comprend bien sûr la CAO, le PLM, des applications en lien avec l'IoT pour la gestion de production et l'informatique de gestion (SAP, Siebel...). « C'est un environnement très hétérogène sur le plan technique, comme chacun peut le voir, mêlant des apps mobiles, du client web et du client lourd traditionnel » souligne Alexandre Barbier, Product Owner « Cloud » & End to End monitoring chez Airbus Helicopters. Comme pour tout industriel, la disponibilité applicative est un sujet critique. L'entreprise a eu recours aux solutions de Dynatrace pour assurer le monitoring de son parc et atteindre les objectifs assignés en disponibilité à moindre coût.

Chez Airbus comme ailleurs, le monitoring vise à couvrir quatre champs : l'alerte (détection d'anomalies et d'incidents), l'analyse (diagnostic, performance, utilisation), l'affichage (usages par les clients internes, management) et l'optimisation (sur les efforts et les coûts). En cas d'incidents, il faut que les bonnes équipes soient averties. Au delà, il s'agit, au long cours, d'accroître la performance applicative et de diminuer les coûts de fonctionnement. « En matière d'affichage, le management souhaitait disposer d'informations précises sur ce qui se passe dans le SI sans avoir à attendre des rapports ponctuels » mentionne Camille Allavena, application performance monitoring delivery manager chez Airbus Helicopters. Celle-ci souligne : « le marché étant ce qu'il est, les équipes sont limitées et on ne peut pas se permettre d'avoir des solutions insuffisamment efficientes. »

Une histoire de plus de dix ans

Lorsqu'Airbus s'est intéressé au sujet, il y a une dizaine d'années, l'entreprise a fait un tour du marché. Les solutions Dynatrace ont été déployées à l'époque, déjà, autour de Citrix, de SAP et de Catia (CAO Dassault Systèmes). Camille Allavena se souvient : « à l'époque, la demande était limitée et il s'agissait en fait juste de savoir si l'application fonctionnait ou pas. » L'analyse de performance (en commençant par six applications du portail client) n'a démarrée qu'en 2013. En 2017, Airbus a choisi la version conteneurisée et hébergée chez un tiers, Dynatrace Managed. Puis c'est une application particulièrement critique et source de soucis de performance, la gestion de production Delmia Apriso de Dassault Systèmes, avec des systèmes connexes, qui ont été intégrés au suivi en 2018. Enfin, en 2020, les autres systèmes de monitoring ont été décommissionnés, Dynatrace Managed a été généralisé sur toutes les applications critiques et un outil a été développé pour vérifier le respect des niveaux de services (SLA) à partir des données Dynatrace. Alexandre Barbier relève : « Ces indicateurs sont partagés autant avec les utilisateurs métier qu'avec la direction de l'entreprise ».

Alexandre Barbier, Product Owner « Cloud » & End to End monitoring chez Airbus, souligne l'importance d'indicateurs partagés dans toute l'entreprise.

La solution a donc été déployée autant sur le datacenter traditionnel, le cloud privé et le cloud public AWS. Les alertes de performance sont filtrées de telle sorte à ce que seuls les problèmes dépassant des seuils pré-établis soient remontés. Lorsqu'il y a un véritable problème de disponibilité, l'incident est isolé sur un rapport spécifique. « Il s'agissait pas de cacher des choses, la vérité provenant clairement de Dynatrace, mais d'avoir un ensemble d'indicateurs homogènes au niveau groupe sur des niveaux de service attendus » pointe Alexandre Barbier.

Du global au détail

Bien sûr, les tableaux de bord permettent d'avoir une vision globale. Camille Allavena indique : « lorsque l'on clique sur un incident, on peut avoir le détail de l'impact et de l'analyse des causes. C'était vraiment ce que nous voulions pour nos rapports à notre direction. En quelques clics, on a donc un taux de disponibilité tel jour et ensuite un détail de chaque problème et de sa cause. ». La démarche a été standardisée sur l'ensemble du parc applicatif et permet une analyse effective. « Derrière notre portail client, il y a 82 web-services » relève ainsi Camille Allavena. En cas d'incident sur le portail, il faut en effet bien sûr analyser précisément ce qui s'est passé, quel problème précis a été rencontré et quelle en a été la cause. C'est bien tout le parcours d'un utilisateur qui peut ainsi être suivi, avec une liste exhaustive des incidents, et qui peut le cas échéant être rejoué à des fins d'analyse.

A partir de ces données, le travail sur la performance peut être effectif. Et cela quelque soit l'infrastructure considérée (cloud privé, datacenter traditionnel, cloud public) mais de manière consolidée. Une fois le monitoring mis en oeuvre, les usages se sont multipliés et les utilisateurs finaux ont pu faire des demandes pour améliorer leur quotidien. Déploiement, paramétrage et autres tâches répétitives sont désormais largement industrialisées. L'automatisation apportée a ainsi permis de faire du « monitoring as code ». « Les équipes peuvent se concentrer sur la valeur apportée aux utilisateurs » se réjouit Camille Allavena.