L'éditeur français Talend vient d’annoncer que sa solution d’intégration de données fonctionnait maintenant avec Redshift Serverless, le service de datawarehouse « à la volée » livré mi juillet au niveau mondial par Amazon Web Services. Ce dernier permet de lancer des charges de travail analytiques sur des pétaoctets de données en quelques secondes en intégrant rapidement différentes sources de données dans une plateforme entièrement administrée par AWS. Le service dispense ainsi de devoir constituer un entrepôt de données et d'en gérer l'infrastructure. Dans de nombreux cas d’usage, Redshift Serverless peut ainsi réduire de façon très sensible les temps de production des rapports d’analyse, qui sont obtenus en quelques heures contre plusieurs jours jusque-là.

Sur ce service, Talend apporte sa fonctionnalité Trust Score pour gérer la qualité des données. Par ailleurs, Talend prend en charge l’intégration native de Stitch avec la console d’AWS. Ce service ETL dans le cloud permet d’ingérer et de transformer en quelques minutes des données dans Redshift. En Europe, le service de datawarehouse est disponible en mode serverless dans les régions de Francfort, Stockholm et Londres. En dehors de Talend, d'autres fournisseurs d'outils d'ETL se sont également rapprochés de Redshift Serverless, notamment Qlik (avec Sense et Data Integration).

Au printemps dernier, Talend a racheté Gamma Soft et sa solution de CDC - capture des changements de données - et il a lancé la version Spring ’22 de sa suite d’intégration de données. A cette occasion, Christal Bemont, la CEO de Talend, a répondu aux questions de la rédaction de LMI.

LMI : Votre catalogue comportait déjà des outils de CDC. Qu’apporte de différent la solution de l'éditeur français Gamma Soft et quand sera-t-elle intégrée à Open Studio ?

Christal Bemont : Talend a pour objectif d'aider les entreprises à obtenir une plus grande valeur ajoutée grâce à des données fiables. Notre acquisition de Gamma Soft étend nos capacités de réplication de données en temps réel pour aider les entreprises à harmoniser leurs initiatives de modernisation de données et à répondre aux besoins d'analyses avancées dans des environnements hybrides et multi-clouds. Cette acquisition permet à nos clients d'éviter davantage les pertes de données, de garantir la qualité et la disponibilité des données pour tous les cas d'utilisation et de réaliser leurs objectifs commerciaux. Les détails concernant nos plans d'intégration et la mise sur le marché de Gamma Soft seront dévoilés au troisième trimestre.

Quels sont les apports les plus importants de la version Spring ’22 de Talend ? 

L'année dernière, nous avons révélé dans une enquête que seuls 40 % des dirigeants déclaraient avoir toujours confiance dans les données avec lesquelles ils travaillent. Notre Talend Trust Score a été développé pour aider à résoudre ce problème de confiance car il évalue instantanément la fiabilité et la santé des données d'une organisation. Dans notre version Spring'22, nous avons ajouté des fonctionnalités avancées au Talend Trust Score, permettant aux professionnels des données de surveiller la qualité de celles-ci aux niveaux macro et micro, et la possibilité de visualiser les changements et les impacts de la qualité des données dans le temps.

Une autre mise à jour importante à souligner dans cette version est la plus grande collaboration entre les utilisateurs IT et métiers avec notre nouveau concepteur de règles de qualité de données, où la qualité de données devient une responsabilité partagée.

Quelles évolutions sur votre service cloud de réplication de données Stitch, en particulier parmi les clients français qui peuvent maintenant accéder à un datacenter à Francfort ?

La demande d'applications de données en libre-service basées sur le cloud est motivée par la nécessité d'une meilleure connaissance des données et d'une culture des données à l'échelle de l'entreprise, où les utilisateurs métiers disposent d'une plus grande autonomie numérique. Des applications comme Stitch brisent les silos entre l’IT et les utilisateurs métiers et réduisent le temps de traitement des données, ce qui permet des analyses plus rapides. Cependant, le besoin en solutions en libre-service entraîne également des problèmes de gouvernance - qui est propriétaire des données, où les données sont-elles traitées. Ceci est particulièrement significatif dans un monde où le poids des réglementations relatives à la confidentialité des données est devenu de plus en plus important.

Le datacenter Stitch en Europe aide nos clients en France à naviguer dans l'environnement réglementaire actuel et à respecter leurs propres obligations de conformité. Cette agilité aide nos clients à réussir leurs projets de transformation des données et à atteindre leurs objectifs commerciaux. Un excellent exemple est celui de Tape à l'œil, une enseigne française de vêtements pour enfants, qui s'appuie sur Stitch pour intégrer rapidement les données provenant du Web et des plateformes de réseaux sociaux et analyser les performances de vente.

Quelles sont les principales difficultés rencontrées par vos clients dans leurs projets d’intégration de données ?

Plus de 70 % des entreprises affirment qu'elles ne sont pas encore « data-driven ». C'est une statistique intéressante, sachant que les entreprises ont investi des milliards de dollars dans les technologies d'infrastructure de données. Je pense que cette situation vient du fait que l’attention se porte davantage sur les problèmes liés à la capture, au déplacement et au stockage des données que sur ce que les organisations souhaitent, c’est-à-dire transformer les données en valeur.

Sur quels sujets la R&D de Talend travaille-t-elle en ce moment ?

Donner à un plus grand nombre de personnes les moyens d'utiliser les données et répondre à la nécessité d'une plus grande maîtrise des données continueront de guider nos efforts d'innovation et nous continuerons à créer des fonctionnalités pour répondre aux besoins de tous les professionnels des données, selon leur niveau de technicité. À mesure que nous démocratisons le travail sur les données, nous reconnaissons qu'il est impératif de rendre les applications plus intelligentes, et l'intelligence artificielle et l'apprentissage automatique joueront un rôle important à cet égard. Le libre-service et la démocratisation, ainsi que l'observabilité et la correction de la qualité des données dans l'ensemble de l'écosystème applicatif de Talend resteront également des priorités pour nous.

Quels types d’évolutions peut-on s’attendre à voir sur le marché de l’intégration de données dans le futur ?

Pour aider les entreprises à obtenir des données saines, il est nécessaire de s'éloigner du simple transfert de données d'un point A à un point B pour se concentrer sur l'obtention des données de confiance, l'augmentation de leur utilisation par tous et la création de résultats commerciaux.

Le manque de ressources qualifiées et l'urgence d'obtenir des informations précieuses à partir des données poussent le marché vers une plus grande automatisation de l'intégration et de la gestion des données. Les technologies d'IA et de ML aideront les équipes chargées des données à réduire le temps de traitement - ingestion, intégration et transformation - rendant les données disponibles plus rapidement pour des analyses en temps réel.

La nécessité d'une culture des données étendue à l’ensemble de l'entreprise augmente le besoin en applications en libre-service qui peuvent être utilisées par un plus grand nombre de professionnels des données. Cela permet d’avoir un sens partagé de responsabilité vis-à-vis des données tout en brisant les silos entre l’IT et les utilisateurs métier.

Enfin, les organisations recherchent plus d'agilité et de rapidité pour gérer les cas d'utilisation critiques pour leurs activités, tels que la vue client 360, l'edge computing, la confidentialité des données ou l'internet des objets ; nous voyons maintenant certaines organisations réfléchir à la mise en œuvre de nouvelles approches comme le « data mesh », y compris les données en tant que produit et la gouvernance des données distribuée.

Propos recueillis par Maryse Gros