HPE avait annoncé fin octobre son prochain modèle de supercalculateur haut de gamme Cray, le GX5000. Succédant à l'EX4000, il équipera le Laboratoire national d'Oak Ridge (ORNL) du département américain de l'Energie (DOE). Le fournisseur avait également glissé que du refroidissement liquide direct (une technologie que l'on retrouvera aussi dans les racks AI200 et AI250 de Qualcomm) et le support des CPU Epyc Venice et GPU Instinct MI430X d'AMD « qui offrent des performances et une précision avancées pour les projets de modélisation, de simulation et d'IA », allaient être de la partie. En amont du Supercomputing 25 (à Saint-Louis du 16 au 21 novembre), le fournisseur américain a indiqué que ce sera aussi le cas de la prochaine génération de GPU Nvidia Rubin et apporté d'autres précisions. Tous ces modèles de puces seront lancés en 2026, ce qui devrait aussi être le cas pour le GX5000.
Chaque système HPC peut contenir jusqu'à 44 racks, chacun pouvant accueillir entre 28 et 40 lames, dont trois derniers modèles ont été annoncés : GX440n, GX350a et GX250. Le premier, GX440n Accelerated Blade, est taillé pour le calcul à précision mixte, avec quatre CPU Vera et huit GPU Rubin fournis par Nvidia. Il est possible de configurer jusqu'à 24 de ces lames par rack de calcul pour un total de 192 puces Rubin par rack. Le second modèle de lame (toujours pour du calcul à précision mixte) est le GX350a Accelerated Blade, qui comprend un processeur Epyc Venice et quatre GPU Instinct MI430X d'AMD sachant qu'il est possible de configurer jusqu'à 28 de ces lames par rack de calcul. Enfin, le dernier modèle, Compute GX250, est destiné aux entreprises qui souhaitent une partition CPU uniquement pour les charges de travail en double précision, avec huit processeurs Venice par rack. A noter qu'il est possible de configurer jusqu'à 40 de ces lames par rack.
Interconnexion réseau haute performance 400 Gbps
Le système HPC GX5000 bénéficie d'une interconnexion réseau haute performance de 400 Gbps Slingshot développée par HPE. Les trois lames peuvent être configurées avec quatre ou huit ports Slingshot par lame via une carte réseau PCIe liquide direct. « Un nouveau châssis a été développé pour le commutateur à lame à refroidissement liquide direct à 100 %, qui dispose de 64 ports 400 Gbps et est déployé dans les configurations suivantes : 8 commutateurs avec 512 ports, 16 commutateurs avec 1 024 ports, et 32 commutateurs avec 2 048 ports », explique HPE. La société propose par ailleurs (en option) pour sa dernière génération de HPC un système de stockage K3000, basé sur son serveur ProLiant Compute DL360 Gen12 répondant aux spécifications de l'architecture de stockage Daos, taillée pour l'exascale. Plusieurs tailles et configurations sont annoncés. L'une d'elle est orientée pour la performance avec huit, douze ou seize lecteurs NVMe, une autre pour de la capacité avec jusqu'à 20 lecteurs NVMe supportés. Leur volume peut être de 3,84 To, 7,68 To ou 15,36 To et la configuration DRAM de 512 Go, 1 024 Go ou 2 048 Go.
HPE a également annoncé une mise à jour du logiciel Supercomputing Management Software permettant aux entreprises de déployer des charges de travail convergentes IA et HPC sur son dernier système Cray. Il ajoute des environnements multi-hôtes, virtualisés et conteneurisés et fournit une gestion de l'alimentation à l'échelle du système qui atteint 400 kilowatts et pourra potentiellement grimper jusqu'à 1 mégawatt.

Commentaire