Comme la plupart des secteurs, la médecine exploite de plus en plus le patrimoine de données pour accroître sa performance. Au laboratoire de biochimie métabolique du CHU de Rouen, affilié à l'Inserm (Institut national de la santé et de la recherche médicale), l'activité est, assez classiquement pour ce type de service, mixte : d'une part le diagnostic des maladies rares (plus un diagnostic de recours lorsque des moyens courants ont échoué), d'autre part de la recherche sur ces maladies. Les moyens utilisés comprennent notamment le séquençage de nouvelle génération, de la spectrométrie de masse, etc. Ces moyens génèrent bien sûr de la data et il s'agit d'en optimiser l'exploitation.

Les données de base comprennent beaucoup de données structurées (classiquement : des dosages suite à des analyses) et, de plus en plus, des données non-structurées de contextualisation (comptes-rendus...). Evidemment, le problème majeur est l'industrialisation du traitement des données non-structurées. « Il n'existe pas d'outil mature largement diffusé pour cela » déplore Abdellah Tebani, maître de conférence des universités, praticien hospitalier et pharmacien biologiste, responsable de la valorisation des données du laboratoire de biochimie métabolique.

Lire la suite