Pour sa prochaine génération de supercalculateurs, Cray a voulu optimiser radicalement les I/O au niveau de chaque noeud. Le supercalculateur XC30 s'appuiera ainsi sur le système d'interconnexion Aries développé par le constructeur américain et sur une topologie de routage spécifique. Mises ensemble, ces deux innovations doivent permettre d'améliorer considérablement la bande passante interne.

Optimiser les I/O est important parce que «plus les processeurs deviennent rapides, plus il y a de données qui doivent entrer et sortir des processeurs pour les alimenter », a déclaré Barry Bolding, vice-président du marketing d'entreprise chez Cray. « La vitesse à laquelle les données doivent entrer et sortir du noeud a augmenté, et le réseau doit être en mesure de suivre.»

Attendu pour le début de l'année prochaine, le supercalculateur XC30 de Cray sera le premier et le seul ordinateur de la gamme XC a sortir dans les cinq prochaines années. Pour mettre au point cette architecture, en développement depuis plus de six ans, le constructeur a focalisé son travail sur l'amélioration de la bande passante globale. Comme l'a expliqué Barry Bolding, « il fallait donner à la machine la capacité de soutenir une lourde charge de travail quand tous les processeurs communiquent avec tous les autres processeurs. »

Gérer 120 millions d'I/O

Grâce à ce système d'interconnexion, chaque noeud est capable de traiter 120 millions d'entrées/sorties par seconde, contre 30 à 40 millions d'I/O par seconde pour la génération de supercalculateurs Cray XK précédente. Dans le nouveau système, chaque noeud dispose de sa propre interconnexion Aries 48-port. « Aries est unique dans le sens où il assume à la fois les fonctions de carte réseau et de routeur, offrant à chaque noeud un accès direct à tous les autres noeuds dans le système », a précisé le vice-président du marketing d'entreprise chez Cray.

Au mois de mai dernier, Cray a vendu - pour 140 millions de dollars - à Intel son programme de développement de matériel d'interconnexion, et une grande partie de la propriété intellectuelle à l'origine d'Aries. Ce dernier s'appuie sur le bus PCIe-3, préféré par Intel.

L'architecture XC dispose également d'une topologie réseau spécifique, appelée Dragonfly, qui relie tous les noeuds. Considérée comme une topologie de réseau directe, nécessitant moins de liaisons optiques et sans commutateurs externes, Dragonfly est le résultat des recherches menées conjointement par les ingénieurs de Cray et une équipe de l'Université de Stanford.

[[page]]

Traditionnellement, les supercalculateurs de Cray sont achetés par le ministère de la Défense et les universités, mais le constructeur américain vend aussi ses machines à des compagnies pétrolières, des fabricants d'équipement et d'autres grosses entreprises qui ont besoin de machines puissantes pour la recherche. Le prix du supercalculateur XC30 démarre à 500 000 dollars. Mais « l'an prochain, Cray prévoit également de sortir une petite version du XC pour les entreprises », a déclaré Barry Bolding.

Bon nombre de technologies présentes dans le XC30, Aries compris, ont été en partie financées avec la récompense reçue par Cray de l'agence Defense Advanced Research Projects Agency (DARPA) dans le cadre de son programme High Productivity Computing System. « Le programme a été conçu pour faire émerger une prochaine génération de supercalculateurs de production», a déclaré le vice-président du marketing d'entreprise chez Cray.

Un système pouvant atteindre 100 Petaflops

Chaque armoire XC30 fournira 66 téraflops et pourra être agrégée en un système offrant plus de 100 petaflops. Chaque armoire sera composée de trois châssis, avec 16 lames par chassis et 4 noeuds par lame. Le système peut comporter pas moins de 92 544 noeuds, chacun supportant jusqu'à 128 Go de mémoire DDR3. Dans un premier temps, Cray va utiliser pour son système les processeurs Intel Xeon E5-2600. Eventuellement, les systèmes XC pourront également utiliser des coprocesseurs Intel Xeon Phi associés à des GPU Tesla de NVIDIA basés sur l'architecture Kepler de prochaine génération. Les superordinateurs XC sont également dotés d'un type de refroidissement particulier qui utilise à la fois l'air et l'eau et ils n'obligent pas à respecter la configuration aile chaude/aile froide.

Les systèmes tournent sous le Cray Linux Environment, un pack logiciel qui inclut le système d'exploitation Linux, le système de fichiers Lustre, le support du langage de programmation parallèle Chapel, et SLURM (Simple Linux Utility for Ressource Management).

Cray a déjà vendu six XC30 à des organismes comme le CSCS (Swis National Supercomputing Center), le Finish IT Center for Science, le National Energy Research Scientific Computing Center (une entité du Ministère de l'Energie) et le Centre de Calcul Haute Performance de l'Université de Stuttgart en Allemagne.