C'est un ouvrage ambitieux que viennent de publier les éditions ENI, autour du thème aujourd'hui incontournable des données. À travers ce livre intitulé « La Data - Guide de survie dans le monde de la donnée », l'auteur Benoît Cayla a en effet cherché à concevoir un manuel pratique pour aborder l'univers data dans son ensemble, non pas sous un prisme particulier, mais bien de façon globale, en passant en revue l'ensemble des principes et concepts qui le sous-tendent.

Dans l'introduction, Benoît Cayla souligne le virage majeur qu'a pris l'informatique depuis une dizaine d'années. D'une focalisation sur les processus, elle a en effet basculé vers ce qu'il nomme « l'ère de la donnée », un tout autre monde dans lequel il s'agit de traiter des problèmes de plus en plus complexes. Pour y répondre, « la solution n'est plus seulement dans tel ou tel langage. La réponse ne se trouve d'ailleurs plus dans la manière rigoureuse de traiter l'information, mais plutôt dans l'information elle-même », pointe l'auteur, qui note un peu plus loin que les programmes actuels sont bien souvent « de simples taxis de data. »

Du stockage à la valorisation par l'IA

Ingénieur informatique de formation, Benoît Cayla a plus de vingt ans d'expérience dans le monde de la donnée. Il a notamment travaillé chez des acteurs tels qu'IBM, Informatica et Tableau et il occupe actuellement la fonction de leader technique chargé des alliances technologiques pour la zone EMEA chez l'éditeur de RPA Blue Prism. Avec son guide, son objectif n'est pas d'ajouter un nouveau livre à tous ceux qui décrivent les solutions de gestion de données existantes. Ce n'est pas non plus de revenir sur le « tsunami de données » et toutes les analyses accompagnant ce constat, aujourd'hui devenues des évidences. Enfin, il ne cherche pas à détailler les cas d'usage autour des données, « parce que la donnée concerne absolument tous les cas d'usage. » Non, le but de Benoît Cayla est plutôt de « fournir un ciment entre ces ouvrages, un guide pratique pour ceux qui veulent [...] mettre un pied dans le monde de la data. »

Son guide de survie, rédigé dans une optique pragmatique, dresse un panorama pratiquement à 360° de ce fameux monde de la donnée. Organisé en sept grands chapitres, il revient tout d'abord sur les concepts fondamentaux, la définition et les propriétés d'une donnée. Il aborde ensuite la notion de persistance et présente les différentes technologies permettant d'assurer celle-ci, notamment les différents types de bases de données. Le troisième chapitre s'intéresse aux enjeux d'intégration, tandis que le quatrième se penche sur l'analyse et la mise en qualité des données. De façon logique, le chapitre suivant traite de la gouvernance. L'auteur évoque ensuite les possibilités de valorisation des données à travers l'intelligence artificielle, pour finir par un chapitre consacré aux grandes solutions de gestion de données, qui détaille les principales architectures existantes : data warehouses, data lakes, référentiels de données maîtres, data hub et plateformes EDI. Un glossaire est également inclus en fin d'ouvrage pour aider les lecteurs moins familiers du domaine à s'approprier le vocabulaire.

Selon l'auteur, le livre s'adresse à tous ceux désireux de mieux comprendre le monde de la data et de l'aborder de façon concrète. Il s'agit aussi bien d'étudiants que de professionnels de la data (ingénieurs, data scientists), mais aussi de développeurs, chefs de projets et bien entendu de chief data officers - autant de métiers nés de ce nouveau monde data-driven ou transformés par celui-ci.