La donnée est souvent considérée comme l'or noir du 21ème siècle. Mais pour en tirer un bénéfice, elle doit, au même titre que le pétrole, être raffinée. Un exercice important, qui peut être source de perte de temps, comme le montre une étude commandée à IDC par Alteryx, éditeur d'une plateforme d'analyse. Menée auprès de 400 professionnels en Amérique du Nord et en Europe, cette étude pointe le temps perdu par les analystes des données dans la recherche et la préparation des data.

Ce travail amont représente à lui seul 73% du temps des analystes de données. Ces derniers ne consacrent que 27% de leur temps à l'analyse et in fine à valoriser les données. Dans le détail des heures gaspillées, le rapport constate qu'un data analyst passe par semaine 14 heures sur des tâches sans valeur ajoutée. Il consacre 3,9 heures à la recherche, 4,6 heures sur la protection et 5,5 heures à la préparation. L'étude souligne qu'avec l'accroissement du volume de données, ce temps perdu va s'amplifier. En complément de ce gâchis horaire, les responsables perdent 10 heures à recréer des données existantes à cause d'une mauvaise communication en interne. Au final, c'est 50% du temps des data analyst qui est mal utilisé ou perdu. En sachant que selon l'étude, une majorité de professionnels de la données travaille plus de 50 heures par semaine.

Jusqu'à 103 millions de dollars perdus pour les entreprises

Qui dit perte de temps, dit aussi perte d'argent pour les entreprises. Pour IDC, l'inefficacité dans l'agrégation des données coûte près de 1,7 million de dollars par an aux entreprises américaines de plus de 100 salariés. En Europe, la perte annuelle de revenu est estimée à 1,1 million de dollars pour la même taille d'entreprise. Si on se réfère à l'ensemble des entreprises, les pertes sont plus élevées : 103 millions de dollars par an aux Etats-Unis et 49 millions de dollars par an en Europe.

La solution prônée par Alteryx est la mise en place de logiciel de catalogue de données gérant l'automatisation des process de recherche de données, s'appuyant sur du machine learning et du partage pour ajouter du contexte. Un monde idéal, mais encore loin de la réalité. Beaucoup de professionnels ne savent pas quelles sont les données disponibles au sein de leur entreprise, d'où elles proviennent, comment y accéder et obtenir des informations fiables. Au-delà de l'outillage, l'étude montre que l'accompagnement et la formation sont des éléments importants.