Chaque année, le Forum Teratec permet de faire un point en France sur les avancées du calcul intensif dont on attend maintenant qu'il diversifie rapidement ses applications et ses utilisateurs. Il s'est tenu la semaine dernière à Palaiseau (1er-2 juillet), à l'Ecole Polytechnique, où il a réuni près de 70 exposants, fournisseurs de technologies (dont Bull, HP, IBM, Intel, HP, Cray ou SGI), de logiciels de calcul scientifique, de prototypage ou d'optimisation (MathWorks, ESI Group, Sysfera, Distene...), intégrateurs (Clustervision, CS, Alineos, Oxalya-OVH...) et institutionnels comme Genci, Inria ou le CEA. Le pôle Systématic est partenaire de l'événement.

Dans l'actualité récente, Nvidia a annoncé sur l'ISC de Leipzig (22-26 juin) l'association de ses accélérateurs graphiques Tesla K20 avec des processeurs ARMv8 64 bits, les X-Gene (server-on-a-chip) d'Applied Micro, pour la construction de systèmes HPC. Peu gourmands en énergie, les ARM 64 bits se destinaient au départ aux terminaux mobiles (Apple les utilise pour ses iPhone 5S) et à des serveurs basse consommation (serveurs web, par exemple). Or dans le monde du calcul intensif, la maîtrise de la consommation électrique est un enjeu crucial. Pour Nvidia, coupler ces puces ARM 64 avec ses GPU est l'une des façons d'y répondre, a confirmé sur le Forum Teratec Denis Gerrer, responsable des ventes HPC du fabricant pour l'Europe du Sud. La technologie ARM apporte les économies d'énergie pour les tâches classiques du CPU et le GPU fournit la puissance de traitement parallèle. Les premières machines exploitant cette combinaison arrivent. L'Américain Cirrascale prend déjà les commandes pour sa plateforme de développement RM1905D intégrant 2 noeuds par rack 1U, avec une alimentation de 400 watt. 

Des combinaisons ARM64/GPU en Europe

Au niveau européen, les Italiens e4 Computer Engineering et Eurotech vont également sortir des machines ARM/GPU, à la fin du mois de juillet pour l'un, au 4ème trimestre pour l'autre. « Eurotech a une solution assez dense avec 8 processeurs ARM et 32 GPU qui tiennent dans 3U, le tout refroidi par eau, c'est très intéressant pour le calcul haute performance », a indiqué Denis Gerrer. A côté du choix ARM, x86 reste important pour Nvidia, a-t-il rappelé, en mentionnant aussi le couplage des GPU aux puces Power d'IBM. Au chapitre de l'efficacité énergétique des solutions Nvidia, Denis Gerrer a cité la 1ère machine industrielle du Top 500 (en 11ème position), mise en service à Pavie par Eni, le fournisseur de gaz italien. C'est aussi la 1ère machine pétascale du classement Green 500 (9ème position) en production chez de très gros industriels, utilisée pour la recherche pétrolière. Les 10 premiers du Green 500 utilisent d'ailleurs tous des GPU K20 ou K40.

Enfin, Denis Gerrer a également évoqué la technologie de commutation rapide NVlink en préparation pour 2016. Ce point avait été abordé le matin par Cyril Zeller, directeur de l'ingénierie chez Nvidia, au cours d'une session sur les recherches menées pour l'exascale en termes d'efficacité énergétique. « Où va l'énergie ? Les mouvements de données consomment davantage que le traitement des données », a-t-il exposé. Les recherches portent donc sur l'amélioration de la proximité physique des composants. Première étape, la mémoire empilée (stacked memory) avec l'architecture Pascal en 2016. La DRAM sera intégrée dans le package du processeur. Quant au switch NVLink, il doit accélérer à moindre consommation les échanges entre CPU et GPU, avec une bande passante de 80 à 200 Go/s.

Nvidia Cyril Zeller, directeur de l'ingénierie de Nvidia, présente NVLink sur le Forum Teratec. (cliquer ici pour agrandir)

Les Xeon Phi montent en puissance chez Intel

Autre actualité récente du monde HPC, l'annonce par Intel (à Leipzig également) de sa puce Xeon Phi Knights Landing dont la puissance de pointe peut dépasser les 3 teraflops. On retrouve ici le recours à la mémoire empilée et à une technologie de fabric, OmniScale, pour accélérer les transferts de données. Le premier supercalculateur à exploiter ces puces sera mis en service en 2016 au NERSC, division du laboratoire Lawrence Berkeley située à Oakland (Californie). La semaine dernière, sur le stand Intel du Forum Teratec de Palaiseau, l'intégrateur français 2CRSi présentait par ailleurs son serveur HPC « 6 Phi » pouvant en fait recevoir dans un châssis 2U jusqu'à 8 Xeon Phi, 2 Xeon E5-2697V2 (24 coeurs) et jusqu'à 1 To de mémoire DDR3 1866 MHz. Soit, selon les versions, une puissance affichée de 9 Tflops pour une consommation de 2400 watts, ou de 11,6 Tflops (avec 512 coeurs).

Serveur 6 Phi de 2CRSi
Le serveur 6 Phi sur le stand d'Intel. (cliquer ici pour agrandir)

Installée à Strasbourg, 2CRSi réalise des serveurs sur mesure adaptés à ses clients français. Ses produits sont aussi vendus par Intel. Après avoir rencontré le fondeur californien l'an dernier, la société s'est fixé le challenge de mettre au point ce serveur HPC dans un châssis très court, relate avec enthousiasme Alain Wilmouth, son dirigeant. Le premier cluster sera livré ce mois-ci. « Nous avons énormément de projets avec Intel. L'idée, c'est de refaire de l'électronique en France », explique-t-il en précisant que sa machine est prête pour le Knights Landing.

Des solutions pour réduire le coût d'accès au HPC

A quelques stands d'Intel, Franck Darmon, PDG de Carri Systems, présentait son XLR4 Blade conçu pour réduire le coût d'accès aux serveurs de calcul. Quatre lames sont réunies dans un châssis 2U, chacune comportant une puce Xeon E3 1200 v3 et un accélérateur graphique Nvidia. L'idée retenue par Carri est d'opter pour un modèle de Xeon moins cher et moins énergivore et d'établir un lien direct entre les parties CPU et GPU. 

« On s'est aperçu que lorsque l'on voulait investir dans le HPC, il fallait passer par du bi-processeur et par une structure plus lourde que le besoin. Nous prenons donc un standard du marché, une carte mère mini-iTX, un processeur Xeon E3 4 coeurs à 65 watts, 16 Go de RAM par noeud et on se relie directement au GPU », nous a expliqué Franck Darmon. La cible principale, c'est le cloud gaming, précise-t-il en citant Bouygues Immobilier qui a retenu sa solution pour faire tourner une application de visite immersive de l'immeuble de bureaux qu'il construit à Rueil Malmaison. « GreenOffice Rueil 3D » se pilote sur le web à l'aide d'une manette XBox PC, après installation d'un logiciel client.