Fort de ses 20 ans d’expertise technologique dans la donnée, Black Tiger est régulièrement confronté aux difficultés des entreprises dans leur bataille avec leurs propres données.
Cette bataille pourrait se résumer en « Comment mettre de l’ordre dans mes données ? » pour en tirer plus de valeur ajoutée et plus de liberté quant à son exploitation.
On peut vraisemblablement répartir les difficultés des entreprises en 4 catégories :
- L’accessibilité à la donnée
- La traçabilité
- La mise en qualité
- L’exploitation pour travailler efficacement
- L’accessibilité à la donnée constitue la première difficulté pour les entreprises dû à la complexité de leur existant :
- Des données réparties dans de nombreux systèmes hétérogènes, à la fois en termes d'infrastructure (cloud public, cloud privé, on premise), de technologies ("vieilles" technologies legacy vs. nouvelles applications, data lake, BI, ..., adossées à des technologies plus "modernes", bases documents, graphes, moteur d'index, services managés, ....
- Des données silotées par application, et donc dupliquées
- Différents types de données allant de la donnée non structurée à la donnée structurée
- Des problématiques d'identification de la "master data", de son "owner" et de ses "experts"
- L'identification, et a fortiori l'utilisation, des données "joignables" entre systèmes hétérogènes est un enjeu très important.
- La traçabilité de la donnée est une deuxième difficulté dans la mesure où, en son absence et en dehors du manque de conformité que cela génère, elle ne permet pas à l’entreprise d’être en contrôle de sa donnée. Le manque de contrôle empêche l’entreprise de comprendre les incohérences, les erreurs et, en conséquence, la ralentit considérablement dans son processus de correction
- Dès lors que l'on a admis que des transformations, plus ou moins importantes, étaient nécessaires pour pouvoir utiliser efficacement ses données, il devient essentiel de garder une traçabilité très précise de ces transformations. Non seulement (dans certains cas) pour des raisons réglementaires (cf. RGPD par exemple), mais également pour des besoins très opérationnels de reprise en cas d'erreurs, de rollback, d'évolution des modèles et des règles, ...
- La traçabilité n'est pleinement atteinte que lorsque les transformations effectuées durant l'ingestion sont efficacement utilisables, notamment en permettant la recherche, l'exploitation automatique etc.
- Il faut aussi que soit rendu possible le traçage au-delà de l'ingestion, une fois les données mises à disposition des autres applications.
- La mise en qualité de la donnée est une troisième difficulté qui semble être une évidence pour tous et une découverte pour personne. Elle reste définitivement une problématique que les entreprises ont du mal à solutionner.
- La mise en qualité des données est toujours un challenge qui peut vite devenir insurmontable pour les entreprises non spécialistes...
- Il s'agit en effet toujours d'un équilibre fragile entre des problématiques totalement génériques et des particularités totalement spécifiques.
- L'enjeu pour les entreprises est donc de bien positionner le curseur entre ce qui relève d'un élément tout à fait standard, sur lequel il est essentiel de ne pas s'évertuer à "réinventer la roue", et ce qui constitue une véritable spécificité de mon secteur, de mon entreprise, sur lequel il faut mobiliser l'énergie pour ne pas m'enfermer dans une approche trop générique qui ne correspondra ni à ma réalité opérationnelle, ni à mes finalités.
- Et cet équilibrage est compliqué quand on n'est pas spécialiste du sujet, et quand on ne dispose pas d'une technologie qui autorise facilement de marier ces deux approches en apparence contradictoires !
- Un autre challenge auquel les entreprises doivent faire face, et qui est toujours à minima sous-estimé et au pire complètement ignoré, c'est l'écart qui existe entre la réalité de la data et sa représentation "idéalisée" par les métiers...
- Enfin, un autre enjeu, qui découle en partie du précédent, est d'être en mesure de traiter différemment la masse, et les exceptions. C'est quelque chose qui est d'autant plus difficile à appréhender pour les non spécialistes que cela dépend des cas d'usage auxquels on destine la donnée !
- Une solution efficace doit permettre de traiter automatiquement le plus de données possibles, réservant la correction des exceptions à des opérateurs métier. Dans pareil cas, il faut aussi pouvoir réutiliser, quand cela est possible, la correction effectuée pour traiter automatiquement les futures exceptions de même nature.
- La dernière difficulté est une exploitation efficace des données. Chez Black Tiger, elle ne se résout que par la mise à disposition des entreprises d’une vue 360 des fournisseurs, des contrats, des partenaires, des produits, des clients, des salariés…Une telle approche ne peut se concrétiser que grâce à une technologie garantissant les 7 traitements de la donnée les plus challenging et les plus fondamentaux : Accessibilité, intégration, qualité, déduplication, aggregation, traçabilité et conformité.
- Le concept clé lorsque l'on parle d'exploitation des données, c'est l'adaptation des traitements aux usages. Dans le monde du big data, il n'existe pas une donnée universellement correcte/dédupliquée/agrégée/conforme, mais bien autant de données que de cas d'usage ! Une approximation, un arrondi, ... peut tout à fait être légitime pour un cas d'usage donné, et catastrophique pour un autre. De même, avoir un consentement sur un email peut s'avérer nécessaire pour une finalité donnée, et pas du tout pour une autre.
Les entreprises ont en face d’elle un marché hétéroclite de solutions rendant flou le chemin à suivre et complexifiant la démarche projet.
La quantité d’offres offertes par le marché noie le client dans un océan de possibilités technologiques très découpées ne l’aidant pas à avoir une analyse globale et cohérente de sa difficulté.
De plus, la diversité technologique pousse le client à tenter de résoudre ses enjeux en adoptant plusieurs technologies qui rendent la réalisation de ce projet difficile, coûteux et parfois sans fin.
Black Tiger se retrouve finalement très souvent à structurer cet ensemble pour en garantir une délivrabilité efficace de la donnée.