En direct de New York - C’est dans un ancien hangar de la marine américaine à Brooklyn, accueillant désormais des start-ups (au sein de l'incubateur New Labs), qu'Intel a dévoilé ses Xeon Scalable, également connus sous le nom de code Purley (voir détails et prix des 50 nouvelles puces sur le site ArkIntel). Reposant sur l’architecture Skylake avec une gravure 14 nm, ces derniers viennent remplacer les Xeon Broadwell et sont spécifiquement désignés pour répondre aux charges de travail les plus complexes comme l’IA, le cloud et les datacenters traditionnels. Cette famille de processeurs se décline en plusieurs versions : De Bronze en entrée de gamme à Platinum en haut de gamme - avec 28 cœurs en 2, 4 ou 8 sockets avec une bande passante de 1,5 To pour la mémoire – pour équiper des serveurs, des baies de stockage et des équipements réseau. La famille Xeon Scalable regroupe en fait des puces S3, S4, S6 et S8 - exit les E5 et E7 - au sein d’une plateforme unifiée avec des références design pour les fournisseurs de serveurs et de services cloud : HPE, DellEMC, Cisco, Huawei, Fujitsu d’un coté, Google et Facebook de l’autre.

 

Toujours gravée en 14 nm, la puce Xeon Scalable inaugure les instructions AVX 512 et l'architecture Mesh. (Crédit S.L.)

Traiter plus de données plus rapidement 

Comme l’a souligné Navin Shenoy, directeur général en charge de l’activité datacenter group d’Intel, « la plateforme [Xeon Scalable] se destine au cloud, à l’analytique et à la 5G pour connecter tous les utilisateurs et rendre le quotidien plus simple et plus sécurité grâce au partage et à l’exploitation des données. Beaucoup de données sont encore créées sans pouvoir être analysées. C’est un changement fondamental pour les prochaines années ». Le gain en performances est estimé à 1,65x (par rapport à la précédente génération) selon le fondeur de Santa Clara qui met en avant trois améliorations principales.

Selon les dirigeant d’Intel, la famille Xeon Scalable vient augmenter les performances des serveurs dans les centres de calcul qui peinent à faire face à l’augmentation de la quantité de données transitant dans le cloud, l’expansion constante des bases de données et des ensembles de données pour l'apprentissage machine. Il s’agit d’optimiser les charges de travail et freiner les coûts opérationnels. 

Les instructions vectorielles AVX 512 – AVX 2 en fait – viennent accélérer le traitement de certaines tâches comme le codage et le décodage vidéo, le chiffrement des VM avec VMware, le traitement d'image, l'analyse de données et les simulations physiques. L’architecture de bus Mesh, déjà dévoilée le mois dernier dans les Core i9, vient remplacer le design Ring introduit avec la plate-forme Nehalem en 2008. « Avec Mesh, en lieu et place du traditionnel ring pour assurer l’échange des données, nous apportons une optimisation au niveau du partage des données et de l’accès à la mémoire entre les processeurs ». Une amélioration devenue nécessaire avec le passage à un maximum de 28 cœurs - et donc 56 threads - par puce. «  Comme nous avons ajouté plus de cœurs, de mémoire et de capacités en E / S, nous avons vu un goulet d'étranglement, et nous avons investi dans cette nouvelle architecture Mesh spécifique pour les datacenters », nous a indiqué Jennifer Huffstetler, responsable marketing Data Center Product d’Intel lors du diner presse organisé à Brooklyn.

Cap sur le réseau 

Troisième amélioration notable QuickAssist Technology (QAT) qui vient accélérer et compresser les opérations de chiffrement sans utiliser de composant dédié. QAT permet d’assurer un chiffrement des données avec un impact inférieur à 0,5% sur la performance, nous a indiqué Jennifer Huffstetler. QAT peut également accélérer le traitement des paquets dans les équipements de sécurité du type firewall (deep packet inspection). Enfin, Intel compte accompagner le mouvement de consolidation dans les réseaux avec la montée en puissance des applications SDN (Network Defined Networking) et de virtualisation des fonctions réseau (NFV).

 

La configuration Mesh optimise l'architecture du processeur pour le partage des données et l'accès à la mémoire parmi tous les noyaux et threads, ce qui permet aux processeurs de passer de deux à huit sockets en accélérant le débit. 

Ce n'est pas seulement la performance brute, mais les fonctionnalités améliorées d'E/S et de traitement des charges de travail qu’attendent les clients dans leurs datacenters, nous a confié Lisa Spelman, directrice générale en charge de la gamme Xeon et datacenter chez Intel. AT&T entend par exemple faire la différence dans ses datacenters pour améliorer les services proposés et tendre vers le Network 3.0. Plusieurs entreprises - dont AT&T et Google - testent depuis plusieurs mois la plateforme Xeon Skylake et trois supercalculateurs exploitant ces puces sont déjà entrées dans le Top500. 500 000 processeurs ont été livrés à plus d’une trentaine de clients a indiqué la dirigeante. Peter Marsden, responsable informatique chez Thomson Reuters a rapporté les gains en réactivité réalisés grâce à l’usage de ces puces pour livrer plus rapidement des analyses financières aux abonnés de l’agence. « Les performances ont augmenté grâce aux dernières puces Xeon d’Intel mais également aux baies flash ». 

Des start-ups exploitent déjà les Xeon S 

Nous avons pu également discuté avec la start-up belge Keemotion, invitée à l’Innovation Center de Brooklyn, sur l’exploitation des processeurs Xeon Scalable pour leur solution de vidéo et d’analyse en temps réel. Keemotion propose une plateforme pour filmer sans opérateur des événements sportifs comme des matchs de basket, de volley, de handball ou de hockey sur glace. Le système repose sur une camera - avec deux objectifs pour couvrir toute la zone sportive – pilotée par une intelligence artificielle qui suit en temps réel les déplacements des joueurs. Les cadrages et les zooms sur les actions sont assurés automatiquement sans intervention humaine grâce à un serveur qui assure le traitement local avec les algorithmes maison et un relais dans le cloud (AWS) pour le streaming et la sauvegarde des matchs.

Alexandre Bustamante, cofondateur et directeur marketing de Keemotion, parmi les partenaires et clients invités au lancement des Xeon Scalable. (Crédit S.L.) 

La Ligue Nationale Française de basket utilise déjà cette plateforme dans près de 50 arènes sportives. Comme nous l’a précisé Alexandre Bustamante, cofondateur et directeur marketing de Keemotion, avant d’adopter cette plateforme, la Ligue de Basket française ne filmait que 20% des matchs. Avec Keemotion, le chiffre est passé à 80%. Développé à l’Université de Louvain avec le concours de fond issus de la Communauté Européenne, Keemotion emploie aujourd’hui 28 personnes avec une R&D en Belgique et une force commerciale très active aux États-Unis pour convaincre les équipes de a NBA. Les Golden State Warriors utilisent déjà la solution de Keemotion.

L'éternel retour d'AMD inquiète peu Intel 

Interrogée sur la gamme processeurs d’Intel pour serveurs, Lisa Spelman nous a indiqué que les Xeon E3 et Xeon D restaient au catalogue pour répondre aux besoins monosocket mais que les Xeon E5 et E7 étaient fondus dans la famille Scalable. Interpellée sur la confusion engendrée chez les clients par les appellation Bronze, Silver, Gold et Platinium, la dirigeante se veut rassurante : « Beaucoup de travail a déjà fait par nos partenaires OEM et la confusion peut être une opportunité d’expliquer en détails les solutions à nos clients qui réfléchissent en permanence au moyen d’optimiser leurs charges de travail ». Questionnée sur la concurrente d’AMD avec la sortie de la plateforme Epyc, Lisa Spelman explique qu’Intel n’a pas encore réalisé de benchmarks avec les puces concurrentes mais indiquent que les clients recherchent avant tout la meilleure performance par watt et par cœur. Précisons que le processeur Epyc le plus cher est facturé 4 000 $ HT chez AMD et le Xeon Scalable 13 000$ HT chez Intel... En fait selon les différents avis récoltés, AMD se concentre principalement sur le marché hyperscale et l'hébergement de VM. Scott Hawkins, directeur marketing chez Lenovo, nous a expliqué que les serveurs maison équipés de puces AMD seraient réservés au marché chinois et plus précisément sur le segment des datacenters hyperscales.

Un wafer et la puce Xeon Scalable au lancement de la gamme Intel à Brooklyn. 50 puces Xeon Scalable ont été annoncées. (Crédit S.L.)

« AMD ne cible pas les datacenters de notre façon, notre gamme est beaucoup plus large avec des puces pour le HPC, les solutions in-memory comme SAP HANA ou les datacenters hyperscales [...] Les besoins des fournisseurs de services cloud ont considérablement évolué et ils peuvent aujourd’hui monétiser des puces hautes performances auprès de leurs clients. Depuis 10 ans, le mouvement est tiré vers le haut ». Et d’autres marchés intéressent Intel comme le réseau où la part de marché du fondeur n’est que de 20% (contre 92% pour les serveurs et même 99% pour la seule partie x86). Nous reviendrons sur ce lancement un peu tard avec les annonces serveurs des principaux fournisseurs OEM. A New York, seul Lenovo - sans serveurs d'ailleurs - était présent à la soirée presse d’Intel au New Labs à Brooklyn, mais HPE et DellEMC ont bien sûr également dégainé des références Xeon Scalable.