L’Institut Carnot CALYM est un consortium regroupant 20 entités comprenant des laboratoires publics de recherche et des groupes coopérateurs. Il a pour objectif d’accélérer l’innovation dans la recherche sur les caractérisations et le traitement des hémopathies lymphoïdes en partenariat public/privé dans l’optique en vue d’améliorer la prise en charge des patients. Cela concerne en particulier les lymphomes, enjeu de santé publique majeur pour ce qui constitue le premier cancer du sang, avec près de 2 millions de personnes touchées dans le monde.

Les membres de l’Institut Carnot CALYM réalisent un important travail de R&D, qui s’est traduit sur la seule année 2023 par près de 250 contrats industriels et 300 publications scientifiques dans des revues internationales à comité de lecture. L’Institut Carnot Calym est animé par une équipe de près de 20 personnes.

C’est au sein de cette structure qu’œuvre Guillaume Codet de Boisse, Directeur du Département Innovations Technologiques, et son équipe, comprenant un data engineer et deux responsables de projet. « Notre principale mission consiste à accompagner les membres du consortium dans leur projet en leur proposant des solutions technologiques susceptibles d’accélérer leurs workflows », résume-t-il.

Être capable de mieux exploiter les données

« Collecter des données dans le cadre de projets de Recherche Clinique est une activité parfaitement maîtrisée par le consortium. Toutefois, la réutilisation de ces données pour des traitements secondaires dans d’autres projets restait compliquée », poursuit Guillaume Codet de Boisse. « Nous avons alors eu l’idée de mettre en place un data hub qui permettrait de mettre à la disposition des chercheurs - qu’il s’agisse d’organisations académiques ou d’industriels - des espaces de travail pour valoriser les données de santé. »

En 2021, une première version du Lymphoma Data Hub (LDH) voit le jour. Une offre basée sur les technologies du cloud Microsoft Azure. « Le LDH permet de centraliser les données d’intérêt identifiées par les chercheurs , en toute sécurité et en toute confidentialité. Le LDH met ensuite à la disposition des chercheurs les outils nécessaires à leur exploitation : bio-informatique, IA, traitement d’image…  » Cette v1 restait toutefois une plateforme "artisanale", construite et administrée en grande partie manuellement, suivant les besoins de chaque projet.

En 2022, le Département Innovations Technologiques de CALYM se penche sur la v2 du LDH, une solution industrielle, plus automatisée et à la gouvernance des données améliorée. « Nous avons choisi de continuer à travailler avec Microsoft, engagé dans une démarche de certification avec les autorités de santé. » Un infogéreur certifié HDS se chargera de l’administration au quotidien du LDH v2, l’architecture de ce data hub étant confiée à TeamWork.

Une offre puissante…

TeamWork s’est appuyé sur un cahier des charges construit autour de quatre projets scientifiques types, avec comme objectif de proposer une plateforme aussi générique que possible, capable de couvrir ces cas d’usage, tout en proposant la flexibilité nécessaire pour s’adapter à d’autres besoins.

Les travaux démarrent en septembre 2023, avec la mise en fonction de la solution le premier trimestre 2024, sur l’un des projets identifiés. Le tout suivi d’une montée en puissance rapide de la nouvelle plateforme. « Au début de l’été, tous nos projets avaient été migrés sur le LDH v2, les derniers composants de la v1 étant désormais tous décommissionnés. »

Notez que la plateforme s’appuie sur des solutions standard du cloud Microsoft Azure : du SFTP pour le transfert des données, des dépôts de données pour le stockage, des machines virtuelles pour les traitements… Mais également sur des outils plus sophistiqués, comme Azure Synapse pour gérer les flux de données ou Azure Machine Learning, chargé de couvrir les besoins en intelligence artificielle.

… mais aussi flexible

« Le point fort de notre plateforme est sa flexibilité. La colonne vertébrale de notre data hub reste commune à l’ensemble des projets, mais les méthodes de structuration, d’enrichissement et d’exploitation des données sont définies projet par projet. » Les équipes techniques de CALYM s’appuient pour cela sur des templates définis par TeamWork, couvrant un large spectre de besoins. Et lorsqu’un cas d’usage sort de ce cadre, TeamWork entre à nouveau en piste afin de proposer une solution adaptée.

L’assemblage de ces composants permet de disposer d’une architecture de confiance, conforme et performante, où rien ne rentre et ne sort sans contrôle. CALYM s’est ici inspiré des Trusted Research Environnements popularisés par le NHS anglais.

Les équipes travaillent d’ores et déjà à l’amélioration de cette plateforme. « Nous voudrions proposer une solution plus proche d’un service en mode SaaS, avec un portail qui permettrait de gérer les projets de façon plus simple, sans devoir se soucier des composants Microsoft Azure mis en œuvre. Nous travaillons également sur de nouvelles solutions d’enrichissement des données. Par exemple l’utilisation du NLP (Naturel Language Processing) couplé avec la solution TA4H* pour de l’analyse de texte, » conclut Guillaume Codet de Boisse.

*Text Analytics for Health : une plateforme d’analyse de texte spécifiquement destinée au domaine de la santé

TeamWork, Groupe international spécialisé dans le conseil, l'intégration technologique et l'innovation.

Vous aussi, optimisez votre gestion des données !
Explorez nos solutions Data Analytics pour transformer vos données en insights stratégiques.

Autres articles :