L'association ExQI (Excellence Qualité des Informations) est née il y a un peu plus d'un an pour promouvoir les bonnes pratiques en matière de qualité des données, notamment en favorisant les échanges entre professionnels concernés. Elle regroupe aujourd'hui environ 70 membres, le plus souvent des personnes physiques, et a organisé son premier événement annuel, Data Excellence Paris 2010, du 8 au 10 décembre 2010 à la Maison des Polytechniciens. Cette association est présidée par Sylvaine Nugier, ingénieur chercheur en système d'information et de surveillance chez EdF. Les interventions mêlaient des communications de type universitaire à des témoignages d'entreprises. 27 orateurs (universitaires, chercheurs, consultants et responsables en entreprises ou administrations) se sont succédés sur les trois jours pour une soixantaine de personnes présentes en séance plénière.

Absence de définition

Assez curieusement, Jacky Akoka, professeur au CNAM où il préside le département informatique, a admis qu'il n'existait aucun consensus sur la définition même du sujet, à savoir la qualité des données. La liste des caractéristiques d'une donnée de qualité ou d'un processus générant des données de qualité n'est donc pas totalement fixée alors même que les premiers travaux de recherche datent des années 80. De la même façon, les méthodologies sont nombreuses et variées. Il existe cependant une liste d'items fréquents caractérisant des données de qualité : exactitude, cohérence, sécurité, fraicheur de l'information, complétude, concision, fiabilité, pertinence, etc. Un certain nombre de ces items sont plus particulièrement intéressants car on peut leur associer une métrique et donc s'en servir pour mesurer la qualité. Ainsi, la fraicheur peut être estimée en fonction de la date de production de l'information.

Une norme ISO de la qualité des données

Malgré ce caractère peu défini du travail exact sur la qualité des données, il existe une norme ISO en cours de mise au point sur le sujet. Peter Benson, directeur exécutif de l'Eccma (Electronic Commerce Code Management Association) et responsable du projet de norme ISO 8000 est venu la présenter lors du Data Excellence Paris 2010. ISO 8000 est basé sur la logique de l'ISO 9000.

« Le coût de développement d'une norme est de l'ordre de cinq millions de dollars et ISO 8000 a été sponsorisée par l'armée américaine qui perdait beaucoup trop d'argent à vérifier la qualité de ses données » a remarqué Peter Benson. Il a ajouté : « un de ses principes fondamentaux, qui va à l'encontre de la volonté de tous les éditeurs de logiciels, est de nettement séparer les données des programmes. » Un autre principe est de clairement séparer une information d'une donnée exploitable.