« Depuis ses débuts, il y a près de 30 ans, Globus existe sous diverses formes. Dès l'origine, nous avons été une organisation guidée par une mission : accroître l'efficacité des chercheurs dans la science et les travaux académiques, en nous concentrant sur des logiciels durables », explique Rachana Ananthakrishnan, directrice exécutive de Globus à l'Université de Chicago, rencontrée lors d'un récent IT Press Tour à Palo Alto. Cette organisation à but non lucratif s'est imposée comme un acteur majeur de l'infrastructure scientifique mondiale, servant un marché très spécifique : la recherche collaborative multi-institutionnelle. La plateforme répond aux défis uniques du monde de la recherche, notamment la nécessité de faire de la « science sécurisée et ouverte », où les données sont protégées pendant la recherche mais finalement publiées. Elle facilite également les collaborations entre dizaines voire centaines de chercheurs issus de différentes institutions, avec des exigences spécifiques par domaine et des accords de protection des données distincts. La technologie Globus a d'ailleurs contribué à trois prix Nobel : le prix Nobel de la Paix 2007 pour l'évaluation climatique du Giec, le prix Nobel de Physique 2013 pour la découverte du boson de Higgs au Cern, et le prix Nobel de Physique 2017 pour la détection des ondes gravitationnelles par le Ligo Lab (Caltech).
Une évolution technologique majeure vers le cloud
Initialement développée comme technologie de grille informatique au début des années 2000, Globus distribuait un toolkit logiciel que les institutions devaient installer et gérer localement. « En 2008-2009, nous avons commencé à observer comment le marché utilisait le produit. Une étude financée par la National Science Foundation nous a permis de réaliser qu'il existait une lacune dans la science : des petits laboratoires avec quelques chercheurs qui faisaient d'excellentes recherches, mais n'avaient pas la capacité d'utiliser le type de logiciel que nous distribuions », souligne Rachana Ananthakrishnan. Cette prise de conscience, couplée à l'émergence du cloud computing, a conduit à un pivot produit majeur en 2009-2010 vers un modèle Software as a Service (SaaS) et Platform as a Service (PaaS).
La plateforme Globus agrège différents environnements pour faciliter le partage de données. (Crédit P.K.)
Globus offre aujourd'hui des services complets de gestion des données : transfert managé avec optimisation de la vitesse et garantie d'intégrité, partage collaboratif sécurisé sans réplication de données, et exécution de calculs à distance. L'architecture hybride de la plateforme repose sur des agents locaux déployés dans les institutions, connectés à un service global de gestion et d'orchestration. « Les données elles-mêmes ne transitent que directement de la source à la destination. Elles ne passent jamais par nos serveurs », précise la directrice exécutive, permettant ainsi d'exploiter pleinement les réseaux de recherche à très haut débit de 100 à 400 gigabits. La plateforme s'intègre à une multitude de systèmes de stockage hétérogènes via un programme de connecteurs communautaires, offrant une interface unifiée pour accéder aux systèmes HPC, stockages institutionnels, archives sur bande et clouds commerciaux (AWS, Azure et GCP)
Une adoption mondiale massive
Les chiffres témoignent du succès de Globus : plus de 779 000 utilisateurs et applications enregistrés, 2 600 institutions connectées, 116 100 collections de données actives, et 2 pétaoctets de données transférées chaque jour de manière fiable. La plateforme compte des utilisateurs dans plus de 80 pays et s'appuie sur 2 140 fournisseurs d'identité, permettant aux chercheurs de se connecter avec leurs identifiants institutionnels sans créer de nouveaux comptes. Globus a notamment joué un rôle crucial pendant la pandémie de Covid-19, en renonçant aux frais d'abonnement pour tous les projets de recherche liés au virus. La plateforme a été utilisée pour déplacer 7,5 pétaoctets de données climatiques entre trois laboratoires nationaux américains, et soutient des installations de recherche majeures comme l'Advanced Photon Source du laboratoire national d'Argonne, où elle a permis de réduire le temps de résolution de structures cristallines de semaines à quelques heures. Le consortium international Telomere-to-Telomere l'a également utilisé pour compléter les 4% manquants du génome humain, nécessitant un partage sécurisé de données entre chercheurs du monde entier.
Vers l'automatisation intelligente
La plateforme continue d'évoluer avec l'arrivée de fonctionnalités comme l'automatisation basée sur des politiques, facilitant une orchestration fiable des tâches pilotée par des événements. Globus investit également dans la gestion sécurisée des données sensibles avec des niveaux d'abonnement spécifiques pour les régimes de conformité, et explore le support des systèmes d'intelligence artificielle agentique utilisant l'infrastructure de recherche. Avec un modèle freemium où les fonctionnalités de base restent gratuites pour la recherche à but non lucratif, et des abonnements annuels forfaitaires déterminés par les dépenses de recherche des institutions, Globus s'affirme comme l'infrastructure indispensable de la science moderne.


Commentaire