Fondation privée issue une souscription publique internationale créée en 1888, l'Institut Pasteur se consacre à la recherche biologique et médicale, notamment sur les micro-organismes, les maladies et les vaccins. Outre ses centres à Lille ou dans les COM, l'Institut Pasteur comprend une centaine d'unités de recherche avec 500 scientifiques permanents et 600 de passage chaque année pour un total de 2700 collaborateurs. Le réseau mondial des instituts Pasteur comprend 31 établissements pour un total de 23 000 collaborateurs répartis sur tous les continents.

La méthodologie de recherche suit normalement les étapes suivantes : question, étude, formation d'une hypothèse, test et évaluation des résultats puis, enfin, publication d'un rapport. Les premières phases supposent une recherche documentaire dans les publications antérieures. Or, chaque année, plus de deux millions d'articles sont publiés dans 30 000 revues scientifiques, auxquels s'ajoutent des briques techniques associées (code source, données techniques, échantillons physiques...) accessibles à tous, comme le promeut le mouvement Open Science. Les scientifiques ont de plus en plus de difficulté à exploiter cette base documentaire.

Prédire les caractéristiques des molécules 

« En collaboration avec les experts d'IBM à Montpellier, les équipes de l'Institut Pasteur vont construire un modèle d'apprentissage (Deep learning), entraîné sur la gigantesque banque unifiée de données sur les protéines (PDBe), pour prédire les caractéristiques des molécules qui bloquent les fonctions des protéines impliquées dans diverses pathologies, comme les maladies infectieuses » indique IBM. L'intervention de la firme d'Armonk prend la forme d'un mécénat de compétences et de moyens.

Grâce à l'IA, l'Institut Pasteur compte prédire les caractéristiques des molécules qui bloquent les fonctions des protéines impliquées dans diverses pathologies, comme les maladies infectieuses. Il s'agit de filtrer les meilleures candidates parmi les milliers de protéines envisageables. Au final, il s'agit bien d'accélérer la mise au point de médicaments, des travaux durant habituellement des années pouvant ainsi être accélérés jusqu'à ne prendre que quelques semaines. Cette accélération entraînera aussi d'importantes économies financières. Outre l'apport en expertises en modélisation Deep-Learning, IBM donnera accès à des serveurs de calcul haute performance et d'autres logiciels IBM d'optimisation et de Knowledge Management.

Des résultats prometteurs

Michael Nilges, directeur de la technologie à l'Institut Pasteur, s'est réjoui : «  Les premiers prototypes de la technologie d'apprentissage profond (Deep learning) sont déjà très prometteurs, notamment ceux dédiés à la prédiction de sites de liaison fonctionnels au sein de complexes protéiques impliqués dans diverses pathologies, comme les maladies infectieuses. Une telle technologie d'IA offre de grandes opportunités pour faciliter l'identification de nouvelles cibles médicamenteuses ainsi que le développement de futurs médicaments avec de nouveaux mécanismes d'action. L'Institut Pasteur utilise déjà cette technologie sur site dans le cadre de divers projets de conception de médicaments, notamment pour le SRAS-CoV-2 ».