Fort d’un quatrième trimestre 2021 plutôt bon sur la partie mainframe et stockage, IBM vient de dévoiler la dernière mouture de ses systèmes Z. Le z16 est plus qu’une mise à jour du vénérable mainframe, « cette dernière version change la donne », souligne Ric Lewis, senior vice-président d’IBM Systems. Par rapport à ses prédécesseurs, la gamme Z change de processeur en s’appuyant sur la puce Telum. Le z16 apporte ainsi le premier accélérateur d'IA intégré sur puce. « Avec elle, les entreprises passent au traitement IA en temps réel », a rapporté Elpida Tzortzatos, CTO pour l’IA sur IBM Z, lors d’une conférence de presse. Selon Ross Mauri, general manager d'IBM Z, toute une série de nouvelles possibilités vont s'ouvrir avec l'IA sur le système z16 qui ne pouvaient pas être envisagées auparavant. 

Peu d’éléments techniques ont été donnés lors de cette réunion, il faut remonter à l’été 2021 pour en savoir un peu plus sur cette fameuse puce Telum. Gravée en 7 nm, elle est fabriquée sur les lignes de production de Samsung et intègre 22,5 milliards de transistors sur une superficie de 530 mm². Le processeur se compose de 17 couches avec une horloge de base cadencée à un peu plus de 5 GHz. Il comporte 8 cœurs qui peuvent chacun exécuter deux threads en SMT2, des accélérateurs de charge de travail intégrés et 32 Mo de ce qu'IBM appelle le cache semi-privé de niveau 2. Le cache L2 est dit semi-privé parce qu'il est utilisé pour construire une connexion L3 virtuelle partagée de 256 Mo entre les cœurs de la puce. Le z16 est aussi présenté comme une plateforme ouverte qui s’intègre dans un environnement cloud hybride. A ce sujet, IBM rappelle l’annonce récente de deux services cloud, l’IBM Z and Cloud Modernization Stack et Wazi as-a-service, pour aider les clients à moderniser leurs applications mainframes.

Des performances sur l'IA pour détecter les fraudes et une sécurité résistant au quantique

L'ensemble de la conception a été pensé pour le traitement d’applications en temps réel, par conséquent, l'accent est mis sur les performances à thread unique. Elpida Tzortzatos a donné quelques chiffres sur ces performances, « le z16 est capable de traiter jusqu’à 300 milliards d’inférences IA par jour avec un temps de latence de l’ordre de la milliseconde ». Au-delà de l’aspect technique, la CTO préfère se focaliser sur les usages du dernier mainframe. « Nous avons réalisé une étude concernant l’impact du z16 en matière de détection de fraude. Elle montre que l'application de modèles d'inférence avancés à toutes les transactions bancaires, de cartes et de paiements pourrait réduire les pertes liées à la fraude de 161 milliards de dollars au niveau mondial », précise-t-elle. De même, l’apport de la puce Telum peut réduire les faux positifs qui pénalisent les transactions bancaires, « avec des modèles de machine learning, le taux de faux positifs peut être réduit de 36% », complète la dirigeante. Auparavant, les traitements IA pouvaient passer sur d'autres clouds (avec Model9) ou être assurés par les puces zIIP, utilisées pour déporter des charges de travail, notamment Java (de nombreuses applications pour le mainframe z sont développées en Java). IBM ne facture pas de frais logiciels sur la capacité zIIP sauf en cas d’utilisation d’une capacité de traitement supplémentaire. Model9, de son côté, installe un agent sur les systèmes z pour exporter les données sur les clouds publics et faire de l'analytique et de l'IA, ou il peut exploiter les puces zIIP pour faire de l'analytique.

L’autre volet du z16 est orienté vers la sécurité et surtout vers les menaces futures, en l’occurrence celles liées à l’informatique quantique qui pourraient avoir un impact sur la solidité des algorithmes de chiffrement. Dans ce cadre, la dernière génération de mainframe embarque des technologies de chiffrement basé sur les réseaux euclidiens. IBM n’a par contre pas abordé une autre technologie sur laquelle il est en pointe, le chiffrement homomorphique. Cette méthode vise à résoudre le problème lié au fait que les données ne sont pas chiffrées tout le temps, notamment quand une application doit les utiliser. On notera que big blue fait évoluer la carte de chiffrement Crypto Express qui passe en version 8S (7S sur le z15). Enfin, pour être complet, le z16 sera disponible à partir du 31 mai 2022.