Quelles ont été les principales transformations d'Informatica depuis son rachat il y a cinq ans par des fonds privés ?

Amit Walia : Nous avions trois objectifs principaux. Le premier était de transformer fondamentalement le modèle économique de l’entreprise. Notre chiffre d’affaires reposait sur les licences et nous voulions que nos revenus soient récurrents et prennent plutôt appui sur les abonnements. Le deuxième, lié au premier, était de convertir davantage notre portefeuille de produits vers le cloud et les souscriptions SaaS. Et le troisième portait sur un rebrand de l'entreprise pour nous positionner vers l’architecture et les cas d’usage de prochaine génération pour notre clientèle. 

Comment ont évolué les projets des clients ?

L’une des grandes tendances est que les données et la gestion des données sont désormais un sujet qui est monté au niveau de la direction des entreprises. Tout autour de nous est centré sur des données de haute qualité, « intelligentes ». Et nous constatons plusieurs axes sur les cas d’usage des clients. L’un concerne la modernisation cloud. Chaque entreprise adopte des architectures centrées sur le cloud, qu’il s’agisse de démarrer des initiatives ou de porter une partie de l’existant vers le cloud. Nous n’en sommes vraiment qu’au début et il va y avoir une énorme croissance en ce sens. Deuxièmement, alors que le volume de données explose, leur gestion devient à l’évidence plus complexe, de nouvelles façons de les administrer sont apparues et les clients veulent disposer d’un seul environnement pour tout traiter. La data platform est maintenant une exigence primordiale pour prendre en charge au même endroit leurs flux, leurs batchs, leurs données structurées, non structurées et les différentes formes de traitement et d’intégration de données. Un autre point concerne la gouvernance et les réglementations liées à la protection de la vie privée qui viennent d’arriver. On peut l’aborder sous l’angle de la conformité réglementaire, mais un grand nombre de nos clients considèrent aussi que pour leurs marques, leur réputation et leurs clients, ils doivent mieux le prendre en compte. Gouvernance et protection des données personnelles représentent donc désormais une très très grande partie des investissements de nos clients. Enfin, tout aussi important, chaque entreprise à laquelle j’ai parlé à travers le monde cherche à transformer l’expérience de ses clients et la façon dont elle interagit avec eux. Or une grande part de cette transformation nécessite une meilleure compréhension de vos clients, et c’est finalement un projet de données très complexe. Vous regardez toutes les informations que vous avez sur un client dans la multitude d’applications au sein de votre entreprise, ainsi que sur les réseaux sociaux externes, etc. Transformer l’expérience pour comprendre le client est donc le quatrième axe. Ce sont les quatre mégatendances des investissements des entreprises. 

Quels sont les défis posés par ces projets ? 

Le premier défi est la complexité qui s’est considérablement accrue. Le volume des données double chaque année, la latence a changé - passant du batch au streaming -, de même la variété a changé, nous vivions dans un monde de données transactionnelles structurées, puis sont venues les données semi-structurées et jusqu’aux flux de données non structurées, une complexité que le client veut gérer en un seul endroit. Deuxièmement, le monde technologique se transforme très rapidement, de nouvelles architectures sont arrivées ces cinq dernières années, et cela a créé un challenge important sur les compétences à réunir. Les technologies arrivent plus vite et avant même qu’elles soient largement adoptées, elles repartent, il est donc très difficile d’avoir des personnes qualifiées et l’un de nos objectifs est d’aider nos clients à abstraire la complexité de leur transition technologique pour se concentrer sur leurs objectifs métiers. Et, défi majeur, nos clients sont davantage focalisés sur les résultats business, les données passant de plus en plus dans les mains des utilisateurs métiers. Tout le monde veut y accéder. Je dis souvent que les métiers veulent disposer hier des données de demain pour prendre une décision aujourd’hui, au bon moment. Donc, il faut s’assurer que nous aidons à fournir à nos clients les bonnes données pour le faire, de haute qualité et parfaitement gouvernées.

Comment les outils d’Informatica sont-ils mis en œuvre dans le cloud hybride ? 

Pour moi, le cloud hybride a une définition assez large. C’est à la fois le on premise versus cloud et le multicloud, car les clients choisissent de multiples plateformes et applications cloud. Et notre but a toujours été d’être un fournisseur d’offres de gestion de données hybrides. Nous avons nos offres on premise de départ jusqu’aux offres natives dans le cloud et nous les connectons pour que nos clients puissent les exploiter ensemble de façon transparente, ce qui leur permet en toute confiance d’exploiter leurs processus traditionnels en innovant dans le cloud. Deuxièmement, nous aidons nos clients à se connecter au monde multicloud. Ils utilisent Salesforce, AWS, Azure, GCP, Workday… Nous connectons ces clouds multiples pour eux. 

Les fournisseurs de cloud public peuvent être aussi des concurrents sur les outils d’intégration.

Nous avons des partenariats stratégiques avec chacun d’eux. Il faut regarder les choses avec le regard du client qui veut que nous travaillions avec tout le monde parce qu’il nous considère comme le spécialiste - la Suisse - de la gestion de données d’entreprise. Avec AWS, Azure, GCP, nous avons des produits et des centaines de clients en commun. Chacun d'eux vient à nos conférences parler de nos partenariats. Nous ne sommes pas en concurrence, nous sommes de véritables partenaires stratégiques au service de nos clients dans le cloud. 

Mais ces fournisseurs cloud ont également leurs propres outils d’intégration.

Ils sont complémentaires. Même si, ici et là, il peut sembler y avoir une concurrence à certains endroits, 95% du temps, c’est une relation complémentaire.

Comment le moteur d’intelligence artificielle Claire est-il employé à travers votre plateforme ?

Le moteur d’IA pour la gestion de données Claire est embarqué dans chaque produit de l'Intelligent Platform d’Informatica qui réunit l'ensemble de nos offres. Il aide les clients à être clairvoyants face au déluge de données. Nous voulons appliquer l’apprentissage machine aux cas d’usage de la gestion de données, à l’instar de ce qui s’est passé dans le monde de la consommation grand public, si vous considérez le taggage des photos sur Facebook, les recommandations sur Amazon, les graphes sociaux sur Linkedin, etc. Entre on premise, cloud et multicloud, les clients ont tellement de données qu'ils ne pourront jamais les mettre toutes au même endroit, donc, en premier lieu, avec Informatica, vous mettez toutes les métadonnées en un seul lieu et vous leur appliquez des algorithmes d’apprentissage machine. Et d’un seul coup, comme vous y voyez clair, vous pouvez commencer à tagger vos données et à les comprendre. Même si les informations de vos clients se trouvent dans des bases différentes, nous vous aidons à les appréhender. Par exemple pour simplifier la gouvernance et la mise en œuvre des contraintes réglementaires en comprenant le flux des différentes données. Ou bien, pour l’analytique en self-service, en proposant aux utilisateurs métiers des recommandations sur les jeux de données afin de faciliter l’analyse avant la prise de décision. Donc, Claire aide à compléter un grand nombre de ces fonctions tirées par les objectifs métiers, simplifie leur utilisation et réduit la complexité des données pour les utilisateurs métiers. C’est intégré dans chaque offre d’Informatica et ça le sera de plus en plus.

Pouvez-vous décrire votre « catalogue de catalogues »  qui repose aussi sur l’IA ?

Lorsque nous avons examiné les difficultés rencontrées par nos clients, notre vision a été, il y a six ou sept ans, de créer une plateforme de données mais en laissant les données où elles se trouvent. Google a indexé le Web, personne ne l’avait fait pour les données d’entreprise. Nous avons donc voulu créer Google pour les données d’entreprise en amenant toutes les métadonnées en un seul endroit. Notre catalogue a transformé cette vision en produit. Il indexe toutes les données de l’entreprise et fournit comme un cockpit de tous les actifs de données pour que vous compreniez quelles sont celles qui sont sensibles, celles qui ne le sont pas, de quels systèmes elles proviennent, s’il s’agit de données fiables, de haute qualité, quels utilisateurs y accèdent, s’ils y accèdent souvent, auquel cas les données seront meilleures, à la manière des avis Yelp, etc. Et pour en faire un catalogue de catalogues, nous y amenons les métadonnées de toutes sources générant des métadonnées dans l’entreprise : cela peut venir d’outils ETL concurrents, d’outils BI, de plateformes clouds, de bases de données… Et nous y appliquons divers algorithmes d’apprentissage machine, NLP (natural language processing) notamment, de façon à ce que l’on puisse, par exemple, voir que deux colonnes se ressemblent alors que cela n’apparaît pas à l’œil nu. Le moteur Claire est évidemment fortement intégré à notre catalogue qui devient le système nerveux central de l’entreprise. Pour la migration cloud, cela peut aider à voir que certaines databases contiennent des données particulièrement sensibles et qu’il faut leur faire suivre un chemin différent dans cette migration vers le cloud. Concernant la protection des données personnelles, cela vous dira où elles sont. Dans le cadre du RGPD, vous retrouverez toutes les données liées à un client. Autant de cas d’usage.

Pour gérer la qualité des données, quels sont les derniers outils livrés ?

Nous sommes sur ce marché depuis très longtemps, positionnés leader sur le Magic Quadrant de Gartner et nous avons des milliers de clients dans le monde qui utilisent nos produits de gestion de la qualité des données. C’est un sujet qui ne disparaîtra jamais. En fait, la situation empire avec le volume de données qui augmente, en particulier non structurées, alors que disposer des bonnes données est ce qu’il y a de plus important quand vous faites de l’analytique et que vous devez prendre des décisions opérationnelles. C’est un domaine dans lequel la croissance est grande. L’utilisateur métier a besoin de qualité pour prendre les bonnes décisions. Par exemple, s’il veut lancer une campagne marketing, il lui faut les bons e-mails et pouvoir faire des offres très personnalisées en se référant à l’historique que les clients ont eu avec l’entreprise. La qualité est devenue capitale de différentes manières et nous la rendons plus facile à utiliser par les métiers. Pour écrire des règles métiers, nous employons le traitement du langage naturel. Nous avons embarqué des fonctions NLP pour que les utilisateurs puissent écrire en anglais quelle logique métier ils veulent. Ensuite, le produit de gestion de la qualité transforme le langage écrit en langage technique pour permettre la mise en œuvre de ces règles.

Quelles sont les spécificités des autres briques de l’offre Informatica en sécurité, MDM et gouvernance ?

La gestion des données dans le cloud comporte cinq catégories. La première, c’est l’intégration, nous avons démarré on premise et proposons désormais tout en cloud multitenant. C’est un gros marché pour nous dans lequel nous couvrons toutes les architectures traditionnelles, big data, Hadoop, Spark, cloud… Deuxièmement, nous venons de parler de data quality et de gouvernance, c’est le moteur de très nombreux projets. Troisièmement, le Master Data Management - MDM - qui tire des projets tels que la gestion à 360° des clients, mais aussi la gestion à 360° des produits, des fournisseurs et des données de référence, et là aussi de nombreux cas d’usage. Le quatrième marché, c’est la gestion des métadonnées, incluant le catalogue. Cela va devenir un des drivers fondamentaux pour bâtir une data platform. Et le cinquième, c’est tout ce qui est lié à la sécurité et la privacy. Nous sommes leaders dans ces cinq Magic Quadrants, ce sont des marchés en forte croissance, cela comprend le cloud data management, des marchés de plusieurs milliards de dollars.

Quels sont les objectifs pour Informatica ?

Accompagner le client dans sa modernisation vers le cloud qui n’en est qu’à ses débuts. Nous investissons fortement pour les aider à migrer et gérer le cloud hybride, d’où l’importance de nos partenariats avec les fournisseurs de clouds publics. De plus, nous soutenons nos clients dans la transformation de leurs expériences clients. Et le troisième investissement d’envergure, c’est la gouvernance et la gestion des données personnelles qui n’en sont, elles aussi, qu’à leurs débuts. Les produits de data governance sont la ligne qui grossit le plus vite chez Informatica, une croissance à trois chiffres. Nous avons engagé plus de 2 milliards de dollars ces dix dernières années en ingénierie uniquement sur ces domaines. Il y a deux ans, nous avons fait une acquisition dans la gouvernance et l’an dernier dans le monde de l’expérience utilisateur. Nous sommes très actifs sur les acquisitions, mais nous portons nos choix sur des entreprises qui ont des pools de talents et une bonne propriété intellectuelle. Nous continuerons à le faire.

Quelle évolution demain sur le data management et quel conseil à un CIO ?

L’intelligence artificielle va jouer un grand rôle dans les cinq à dix ans à venir et constituera un gros différentiateur. Beaucoup d’innovations viendront de là. Et vous verrez l’IA de plus en plus embarquée dans nos produits. En tant qu’entreprise, notre objectif est de doubler de taille et nous sommes en bonne position pour le faire. Les CIO qui cherchent un partenaire pour leur transformation doivent prendre en compte deux choses sans lesquelles ils ne pourront pas faire ces grands changements : les capacités d’innovation et de passage à l’échelle.