Le premier supercalculateur exascale européen - le Jupiter Booster, installé au Forschungszentrum (centre de recherche) Jülich (JSC) en Allemagne - et le quatrième au monde est arrivé, opposant les technologies de puces Nvidia aux systèmes x86 (Intel et AMD) qui dominent le domaine du calcul intensif depuis des décennies. Pour la 66e édition du Top500, El Capitan conserve sa première place tandis que le Jupiter Booster devient le quatrième système exascale du classement. Ce supercomputer BullSequana XH3000, conçu chez Eviden, utilise 24 000 puces Nvidia GB200 Grace et offre une performance de pointe d'exactement 1 exaflop, selon le classement Top500 des supercalculateurs publié lundi. La mesure en exaflop est considérée comme une étape importante dans la recherche des limites des performances informatiques. Les performances des ordinateurs actuels sont généralement mesurés en gigaflops et en téraflops, et un exaflop équivaut à 1 milliard de gigaflops. Les GPU de Nvidia dominent le marché des serveurs HPC installés dans les centres de données à mesure que l'informatique évolue vers l'IA. Dans le cadre de cette évolution, les serveurs IA équipés des processeurs Nvidia Grace basés sur Arm apparaissent comme une alternative haute performance aux puces x86.
Jupiter est entré pour la première fois dans le classement Top500 avec une puissance de 793 pétaflops, mais sa construction n'était pas encore terminée. Un nouveau benchmark HPL du système achevé a tout juste dépassé la barre des 1 exaflop. (Crédit Forschungszentrum de Jülich / Sascha Kreklau)
Taillé pour la formation de modèles d'IA et les simulations numériques, Jupiter est le quatrième supercalculateur le plus rapide au monde, derrière trois systèmes équipés de puces x86 AMD Epyc et Intel Xeon, selon le classement Top500. Les trois premiers supercalculateurs du Top500 se trouvent aux États-Unis et appartiennent au ministère américain de l'Énergie. Les deux supercalculateurs les plus puissants, El Capitan (1,8 exaflop) au Lawrence Livermore National Laboratory et Frontier (1,35 exaflop) à l'Oak Ridge National Laboratory, utilisent des processeurs et des GPU AMD. Le troisième supercalculateur, Aurora (1,01 exaflop) à l'Argonne National Laboratory, utilise des processeurs et des GPU Intel. Rappelons qu'Intel a abandonné sa feuille de route GPU après la sortie d'Aurora et est actuellement en pleine restructuration. Le Jupiter Booster, assemblé par le français Eviden, est équipé de la puce GH200 de Nvidia, qui relie deux GPU Hopper (H200) à des CPU Grace basés sur un design Arm (avec 72 coeurs Neoverse-V2). Le processeur et l'accélérateur sont connectés via l'interconnexion propriétaire NVLink Chip-2-Chip (NVLink-C2C), et offre une bande passante pouvant atteindre 900 gigaoctets par seconde. Rappelons que NVLink (reposant sur le protocole propriétaire NVHS pour Nvidia High-Speed Signaling) supplante le bus PCIe pour la communication inter-GPU locale, permettant aux puces graphiques d’échanger des données sans solliciter le CPU ou la RAM principale. Enfin, cette puce Grace exploite jusqu'à 624 Go de mémoire partagée (LPDDR5X pour le CPU et HBM3/3e pour le GPU). Grâce à son énorme capacité de calcul, Jupiter ouvre de nouvelles possibilités dans un large éventail de domaines d'application. Les simulations climatiques et météorologiques peuvent être améliorées et permettront d'affiner considérablement les prévisions relatives aux phénomènes météorologiques extrêmes locaux, tels que les fortes pluies et les orages violents. Jupiter favorisera également le développement et l'optimisation d'un système énergétique durable, explique le centre de recherche de Jülich.
Les échangeurs thermiques Cofinair sur le toit du datacenter modulaire qui abrite le Juniper Booster à Jülich. La chaleur résiduelle générée sera intégré au réseau de chauffage des bâtiments du centre de recherche. (Crédit Forschungszentrum de Jülich / Sascha Kreklau)
Sept des dix supercalculateurs les plus puissants sont équipés de processeurs x86, tandis que trois sont équipés de processeurs Arm. Deux supercalculateurs sont équipés de processeurs et de puces graphiques Nvidia, dont l'Eagle, classé cinquième, qui est un système non exascale appartenant à Microsoft et le supercalculateur le plus rapide appartenant à une entreprise privée. Les mesures du Top500 sont basées sur la mesure des performances informatiques conventionnelles à partir du type de données à virgule flottante FP64, et non sur les performances de l'IA, qui sont basées sur des types de données à faible précision tels que FP32, FP16 et FP8. Cela a conduit les experts à s'interroger sur la pertinence des mesures du Top500, en particulier avec l'influence croissante de l'IA dans les serveurs et les applications. Par exemple, l'Eagle de Microsoft, qui pilote son infrastructure d'IA, n'est pas conçu pour le calcul conventionnel.
Dans cette optique, les animateurs du Top500 ont souligné dans un communiqué de presse l'importance croissante de son benchmark HPL-MxP, qui est conçu pour mesurer les performances de l'IA sur la base de types de données à précision mixte. Ces systèmes ont généralement une concentration plus élevée d'accélérateurs IA. Dans le cadre du HPL-MxP, El Capitan a pris la première place avec un score de 16,7 exaflops, Aurora prenant la deuxième place avec 11,6 exaflops. Frontier, qui occupait la deuxième place dans les benchmarks Top500 traditionnels, s'est classé troisième. Précisons que le Top500 n'inclut plus les systèmes haute performance de Chine, qui ne communique plus sur ses installations de supercalcul, pour cause d'embargos sur les composants clefs a déclaré le chercheur Alex Haag dans un article de blog publié sur le site web de la Réserve fédérale américaine. « Les données souffrent de problèmes d'auto-déclaration, en particulier dans le contexte de la Chine, qui a cessé de déclarer ses supercalculateurs en 2023, ce qui conduit à une surestimation potentielle pour les autres pays figurant sur cette liste », a écrit le chercheur. L'article de blog est lié à un document de recherche sur l'état de l'IA dans les économies avancées publié par M. Haag. La Chine est devenue de plus en plus secrète au sujet de ses ressources en supercalculateurs à la suite des guerres commerciales et des interdictions imposées par les États-Unis sur certaines exportations de puces IA et de processeurs haute performance.
El Capitan a pris la première place à Frontier il y a exactement un an et devrait conserver cette place pendant de nombreuses années, aucun nouveau système exascale n'étant prévu à l'horizon. Mais certains systèmes en cours de développement pourraient remettre en cause la domination d'El Capitan. Au Japon, le Riken - le plus grand institut de recherche multidisciplinaire du Japon - développe le supercalculateur FugakuNEXT, qui comprendra le processeur Fujitsu Monaka basé sur Arm et des puces graphiques Nvidia. Il sera mis en service en 2030, selon un communiqué de presse du Riken. Le système phare FugakuNEXT est conçu pour l'IA. Il succédera au supercalculateur Fugaku, qui occupe actuellement la septième place du classement Top500 et n'est pas conçu pour l'IA. Le département américain de l'Énergie accorde également la priorité à l'IA et à l'efficacité énergétique dans les successeurs de sa gamme actuelle d'ordinateurs exascale. Huit supercalculateurs équipés de GPU Hopper de Nvidia occupent les premières places du classement Green500 du Top500, qui mesure l'efficacité énergétique par rapport aux performances. Deux supercalculateurs équipés du GPU Instinct MI300A d'AMD complètent le top 10.



Commentaire