L’arrivée de l’IA fait bouger les lignes dans plusieurs domaines et notamment dans l’IT et notamment dans les semi-conducteurs. Aujourd’hui, la plupart des applications IA s’appuient sur le traitement GPU mais aussi CPU souvent basés sur Arm comme Nvidia (avec Grace ou Vera) ou la plupart des hyperscalers (graviton AWS, Cobalt pour Microsoft, Axion de Google Cloud). IBM ne pouvait pas rester en dehors de cette tendance et vient de signer un partenariat avec Arm pour développer du matériel double architecture destiné aux systèmes Z et LinuxOne qui embarquent des puces conçues par IBM.
Plusieurs axes de travail
Les deux sociétés prévoient de travailler sur trois axes : la création d’outils de virtualisation pour assurer l’interopérabilité entre les deux plateformes, la garantie de conformité sur les règles de sécurité et de résidence des données pour les secteurs réglementés (secteur bancaire notamment) et enfin la création de couches technologiques communes pour enrichir l’écosystème de fournisseurs et d’éditeurs. Sur la partie virtualisation, IBM n’a pas précisé si elle sera effectuée au niveau de l’hyperviseur via la technologie de partitionnement existante ou par conteneurs. Une question intéressante pour évaluer l’intérêt pratique de cette collaboration.
Rappelons qu’IBM s’appuie sur deux éléments matériels pour traiter les workload IA sur les mainframes : la puce Telum 2 et l’accélérateur Spyre. Développé à l'aide de la technologie Samsung 5 nm, le Telum 2 dispose de huit cœurs haute performance cadencés à 5,5 GHz. Il comprend une augmentation de 40 % de la capacité de cache sur la puce, avec des L3 et L4 virtuels passant respectivement à 360 Mo et 2,88 Go. Il comprend aussi un DPU pour dynamiser les entrées/sorties. De son côté, Spyre également gravé en 5 nm offre des capacités de calcul supplémentaires en matière d'intelligence artificielle. Sur une carte PCIe, le Spyre contient 1 To de mémoire et 32 unités de traitement pour l’IA avec une architecture similaire au DPU de la puce Telum 2. Il est disponible dans les z17 et LinuxONE 5.
Un calendrier non précisé
L’annonce du partenariat a été bien accueillie par les analystes. « Il s'agit d'une stratégie de complémentarité avec les mainframes » explique Rachita Rao, analyste senior chez Everest Group. L’objectif est d’étendre les environnements IBM Z et LinuxONE en permettant aux charges de travail compatibles Arm de s’exécuter au plus près des systèmes d’information. L’accord vise aussi à rassurer certains clients d’IBM comme les banques et les assurances qui « hésitent à changer d’architecture par crainte de compromettre leur intégrité et sont confrontées à une pénurie croissante de spécialiste des systèmes existants », souligne l’analyste. Elle ajoute, « cela ne modifie pas le cycle d’acquisition actuel, mais cela réduit les risques liés à la viabilité à long terme des plateformes LinuxONE ou Z en tant que cloud interne moderne ». Rachida Rao rappelle aussi le partenariat noué entre IBM et Nvidia à l’occasion de la GTC qui s’est déroulé en mars dernier à San José. Big Blue prévoit de proposer les GPU Blackwell Ultra sur son cloud début du deuxième trimestre 2026 pour l'entraînement, l'inférence et le raisonnement en IA à grande échelle. « Cela montre qu'IBM ne considère pas la compatibilité Arm comme la solution principale pour l'IA à grande échelle en entreprise. Celle-ci s’oriente vers des environnements riches en GPU. Cette compatibilité pourrait faciliter l’intégration d’applications ou de services au mainframe, mais elle ne redéfinirait pas la stratégie principale d’infrastructure IA ».
Le calendrier des travaux entre les deux sociétés n’a pas été fixé. IBM n’a fourni aucune date de livraison, ni aucune spécification technique pour les systèmes à double architecture prévus. Les déclarations concernant les orientations futures « ne représentent que des buts et des objectifs » et sont susceptibles d'être modifiées, indique un communiqué.

Commentaire