Les entreprises qui luttent pour se conformer au réglement général sur la protection des données personnelles (GDPR) dans l'Union européenne peuvent jeter un oeil à Conformity Data Lake d'Informatica. Dévoilé cette semaine à la Strata Data Conference à New York (26-28 septembre), cette solution apporte l'apprentissage machine aux problèmes de conformité, afin de donner aux entreprises une vue complète des données stockées, non seulement dans les bases géographiquement dispersées, mais aussi dans les courriels, médias sociaux, messages instantanés, transactions financières et autres sources non traditionnelles.

L'idée est de fournir des analyses et des rapports de conformité plus précis afin d'assurer et de prouver l'adhésion à des réglementations critiques comme GDPR. Le GDPR est la dernière réécriture de l'UE de ses lois sur la confidentialité des données. Il entre en vigueur le 25 mai 2018 et toute entreprise - qu'elle soit basée en Europe ou non - traitant des données personnelles des résidents de l'UE doit se conformer aux nouvelles réglementations ou risquer de payer de lourdes amendes.

L'apprentissage machine au service de la collecte de métadonnées

Le GDPR exige, entre autre, que les entreprises effacent les données personnelles sur demande - à moins qu'il n'y ait une raison légitime de la conserver - informent les personnes touchées par des violations de données, et protégent les données de conception dans leurs produits et services. Afin de répondre à ces exigences, les entreprises doivent essentiellement se renseigner sur le lieu où sont stockées les données, mais pour de nombreuses entreprises, cela peut s'avérer difficile, a souligné le directeur général d'Informatica Anil Chakravarthy. « Il y a tellement de questions fondamentales sur les données que les entreprises éprouvent des difficultés à le faire », indique le dirigeant. « Donc, ce que nous avons construit, c'est une solution pour répondre à ces questions de base. »

La solution d'aide à la conformité GDPR d'Informatica est basée sur le catalogue Intelligent Data Lake, Big Data Management et Enterprise Information Catalog, tous disponibles par abonnement. Le lac Compliance Data est conçu pour exploiter les capacités de traitement et les informations résidant dans le logiciel sous-jacent afin de permettre aux analystes de la conformité des entreprises de créer des rapports de conformité complets et fiables. La clé de cela est la technologie Claire de l'éditeur, qui applique l'apprentissage automatique de la collecte de métadonnées techniques, commerciales, opérationnelles et d'utilisation. Le logiciel est livré avec plus de 150 connecteurs à différents progiciels tiers. « Nous appliquons l'apprentissage par machine pour identifier les relations entre les données dans différentes bases de données », dit Anil Chakravarthy.

Une intégration avec Hortonworks Atlas et Cloudera Altus

Sur la base de cette technologie, Conformity Data Lake détermine où les données résident et applique les politiques de conformité, par exemple en contrôlant l'accès à certaines bases de données. Les données diffusées par Compliance Data Lake peuvent également aider les entreprises à comprendre ce qu'elles doivent faire pour que les ensembles de données résidant en dehors de l'UE respectent les directives GDPR. A savoir garantir le respect des règles de confidentialité lors de l'exportation des informations personnelles des résidents de l'UE hors UE. Informatica a également annoncé que son logiciel s'intègre désormais avec Hortonworks Atlas, un outil de gestion de données conçu pour échanger des métadonnées avec d'autres outils et processus à l'intérieur et à l'extérieur de la pile Hadoop, ainsi qu'avec Cloudera Altus, un PaaS conçu pour accélérer la création et l'exploitation de pipelines de données pour les datalakes cloud.

Informatica est devenue privée en 2015 mais a l'intention de redevenir une entreprise publique à nouveau, indique M. Chakravarthy. En tant que société publique, les rapports trimestriels font l'objet d'un examen minutieux, « il est très difficile de prendre des mesures à long terme comme la réorientation de votre portefeuille de produits autour de nouveaux écosystèmes comme le cloud et les grandes données ». À ce stade, la société a mis ses offres disponibles via abonnement - une grande étape. « Notre objectif est d'entrer sur le marché public », a expliqué le dirigeant. « Nous n'avons pas encore de calendrier, mais nous avons vraiment progressé dans ce sens ».