C'est un fait : la lutte contre le cancer progresse principalement grâce aux essais cliniques. Unicancer, par le biais des vingt Centres de Lutte Contre le Cancer (CLCC) qu'il regroupe, mènent en continu des études cliniques sur des cohortes (groupes formels) de patients. Toutefois, pour y arriver, une analyse fastidieuse des dossiers médicaux doit être menée pour composer ces cohortes en fonction du profil de chaque individu. Les équipes des CLCC doivent en effet effectuer une revue manuelle et minutieuse de plusieurs millions de documents, ce qui alourdit et ralentit drastiquement le lancement des études cliniques.

C'est pour y remédier qu'Unicancer a lancé le projet ConSoRe (Continuum Soin-Recherche). Il vise à mettre en place un outil de recherches qui permettra de constituer rapidement les cohortes de patients réunissant les critères (sexe, type de tumeurs, traitement...) requis pour une étude donnée. Pour accélérer cette phase d'identification, Unicancer a mis en place une chaine motorisée basée sur les solutions AIF et AFS d'Antidot, respectivement pour l'intégration des données et la recherche des information sémantique, ainsi que la plateforme Luxid de Temis pour l'extraction des données sémantiques. Ces informations sont indexées en tant que métadonnées et ensuite restituées sous formes de facettes.

Des volumes de données en augmentation de 50%

Dans le cadre du projet ConSoRe, Temis assure la structuration sémantique des dossiers patients. Il y a égalemment en amont une phase de normalisation des documents autour d'un format pivot. Pour l'instant mené sur quatre CLCC pilotes, le projet permet déjà de simplifier et d'accélérer la sélection des candidats et la composition des cohortes. Il s'inscrit en outre pleinement dans la démarche de transformation numérique d'Unicancer qui voit le volume de données non structurées augmenté de 50% par an. L'analyse des "Big Data textuelles" permet de mieux cibler les axes de la recherche.