Après avoir livré cet été des outils de gouvernance et de catalogage des données as-a-service, Informatica apporte maintenant, avec sa Cloud Data Marketplace, une solution native cloud pour mettre à disposition, à l’échelle d’une entreprise, des jeux de données sélectionnés afin d’en faciliter le partage entre les différents départements et métiers. En fournissant cet accès en self-service à des données correspondant aux besoins les plus fréquents de ses utilisateurs, l’entreprise pourra réduire le temps passé par les différentes équipes de data scientists et autres responsables de la gestion des données à les chercher chacun de leur côté à différents endroits et à les préparer eux-mêmes. Les consommateurs potentiels de ces datasets accèdent à la marketplace créée à travers une interface de type « achat de données en ligne » qui facilite leur recherche à travers les différentes catégories disponibles.

Dans la Cloud Data Marketplace créée, les datasets sont accessibles sur un mode self-service et classés par catégories. (agrandir l'image)

Des modèles d'IA et de machine learning

La marketplace peut également inclure des modèles analytiques et des modèles d’intelligence artificielle et d’apprentissage machine qui seront récupérés sous forme de packages par les équipes de data scientists. La Cloud Data Marketplace se présente ainsi comme un espace d’échange où les data scientists et les utilisateurs métiers pourront rechercher, consommer et publier des jeux de données et des modèles d’IA/ML, résume Informatica. Il est possible de déployer plusieurs points d’entrée de la marketplace afin d'ouvrir des accès à différentes communautés de consommateurs des données. 

Dans une présentation en ligne, le fournisseur explique comment constituer une Cloud Data Marketplace en commençant par la création des rôles d’administration chargés de la superviser (avec des profils IT mais également métiers : administrateur, data steward, profil technique opérationnel) pour ensuite importer les data sets provenant de n’importe quelles sources qu’elles soient hybrides ou multi-clouds.

Les administrateurs de la marketplace déclarent les formats dans lesquels les données sont présentées ainsi que les méthodes d'accès. (agrandir l'image)

Les différentes étapes de validation des données peuvent être automatisées. Sur les aspects de gouvernance, des workflows automatisés affichent aux utilisateurs les termes et conditions d’utilisation des datasets.

En fonction de la nature des données partagées, les conditions d'utilisation sont automatiquement affichées aux utilisateurs. (agrandir l'image)

Migrer les charges ETL de PowerCenter vers IDMC sur Azure 

Cette annonce intervient quelques jours après le retour en bourse de l’éditeur américain, spécialiste de l’intégration de données. Ce dernier était sorti de la cotation après son rachat par un fonds d’investissement, période pendant laquelle il a pu accélérer la transition de ses logiciels vers les services cloud. Sur ce terrain, Informatica a récemment annoncé, à l’attention des clients de sa solution PowerCenter on-premise, un programme conjoint avec Microsoft pour transférer sur le cloud public Azure leurs entrepôts de données et leurs charge de travail ETL actuellement gérés sur leurs propres serveurs. Ces datawarehouses et workloads seront migrés vers la plateforme Intelligent Data Management Cloud (IDMC) d’Informatica sur Azure (disponible sur la marketplace du cloud public de Microsoft) et vers Azure Synapse Analytics.

Ce programme de transfert vers le cloud comprend la Migration Factory pour automatiser plus de 90% des mappings d’intégration existants des clients vers IDMC sur Azure et Azure Synapse Analytics. Il inclut un accès aux experts en stockage et gestion des données cloud des deux partenaires, ainsi que des incitations financières pour réduire le coût de la migration, indique Informatica.