La famille de puces Apple M1 – exploitant un jeu d’instructions ARM - s’agrandit avec une déclinaison monstrueuse, la puce M1 Ultra, dont le design reprend une approche bien connue. En effet, cette dernière combine dans un même bloc deux puces M1 Max en les reliant par un pont en silicium appelé UltraFusion par le constructeur. L’ensemble offre un processeur de la famille ARM avec 20 cœurs, avec 16 de type performance et 4 basse consommation. La puce M1 Ultra fera ses débuts dans le Mac Studio, une station de travail à 3679€ HT également annoncée hier. Selon Johnny Srouji, vice-président senior d'Apple en charge des technologies matérielles, la combinaison de deux puces M1 Max dans un seul bloc permet de contourner les limites physiques des futures itérations du silicium M1. « Ce SoC créé par Apple offre des performances fulgurantes », a déclaré M. Srouji. Il pourrait aussi rivaliser avec les processeurs haut de gamme sur le marché du PC.

M1 Ultra, près de 114 milliards de transistors

Comme l'a indiqué M. Srouji, la puce M1 Ultra possède 20 cœurs au total, ce qui double le nombre de cœurs du CPU Max (et potentiellement les performances), sur le papier du moins. Apple n'a pas fourni de détails sur la technologie de fabrication utilisée par le M1 Ultra, mais on sait que le constructeur a utilisé une technologie à 5 nm pour toutes ses puces précédentes. Potentiellement, la puce M1 est énorme. La M1 Max comptait déjà 57 milliards de transistors, ce qui signifie qu’elle en a logiquement le double. L’illustration ci-dessous fournie par Apple donne une idée de sa taille :

 

Tout à fait à droite, le CPU M1 Ultra d’Apple est tout simplement énorme. On voit bien les deux puces M1 Max et le pont UltraFusion qui les relie ensemble. (Crédit : Apple)

Les deux processeurs sont reliés par l’architecture d’interconnexion UltraFusion, qui fournit 2,5 To/s de bande passante totale entre les deux puces, ce qui, selon M. Srouji, représente quatre fois la bande passante de la principale technologie d'interconnexion multipuces. La bande passante de la mémoire est également augmentée, à 800 Go/s, avec une mémoire unifiée totale prise en charge de 128 Go. La connexion de plusieurs matrices de silicium n'est pas particulièrement nouvelle. En fait, AMD a annoncé sa puce Ryzen Threadripper Pro 5000 le même jour. Le fournisseur de Santa Clara a précisément conçu ce design pour associer un nombre élevé de cœurs de processeur, et la conception combine plusieurs matrices de silicium multicœurs. Par exemple, le Threadripper Pro 3945WX à 24 cœurs comprend trois CCD (Core Chiplet Dies) à 8 cœurs, qui relient les différents cœurs entre eux. À noter que les Threadripper précédents utilisaient des CCD avec ce qu’AMD appelait un CCX, ou Core Complex, qui reliait les puces du processeur avec l'Infinity Fabric d'AMD. Apple adopte ici la même approche. Signalons également que plusieurs sociétés, dont Intel, ARM, Advanced Semiconductor Engineering (ASE), AMD, Qualcomm, Google Cloud, Meta, Microsoft, Samsung et TSMC travaillent de concert sur un standard nommé l’Universal Chiplet Interconnect Express, ou UCIe pour accélérer les échanges entre les différents composants d’une puce. 

 

L'addition des deux die M1 donnent 24 coeurs à la puce M1 Ultra. (Crédit Apple)

Beaucoup de noyaux graphiques dans cette puce doublée, mais une carte externe AMD ou Nvidia fera toujours mieux. (Crédit Apple) 

Pour ce qui est des performances du CPU, M. Srouji a déclaré que le M1 Ultra offrait des performances supérieures de 90 %, dans la même enveloppe énergétique, que la puce la plus rapide à 16 cœurs – la Core i9-12900K d'Intel - pour PC desktop, sans préciser sur quel benchmark s’appuyait Apple pour l’affirmer. En d'autres termes, la firme de Cupertino a déclaré que son M1 Ultra pouvait offrir les mêmes performances de base tout en consommant 100 watts de moins que le 12900K. Précisons toutefois que la sobriété énergétique est un très bon point pour un laptop, dont le châssis peinera à dissiper la chaleur, mais pas dans une station de travail de type tour taillé pour la performance avec une ou deux cartes graphiques discrètes AMD ou Nvidia. 

 

Les informations sur l'outil de test utilisé pour ces deux benchmark manquent pour valider les mesures d'Apple. (Crédit IDG)

On peut supposer que les performances du circuit graphique du M1 Ultra ont également été doublées. Le constructeur a déclaré que sa puce disposait désormais d'un GPU avec 64 noyaux graphiques, soit le double de la puce M1 Max. « Ses performances dépassent également celles du GPU le plus haut de gamme disponible (à savoir le GPU Nvidia GeForce RTX 3090) tout en consommant 200 watts de moins », a affirmé M. Srouji, sans préciser non plus le benchmark de référence utilisé. Par contre, il semble que le pont UltraFusion connecte les deux GPU ensemble, ce que peu de gens attendaient. Enfin, selon Apple, le M1 Ultra dispose de 32 unités de traitement neuronal qui peuvent opérer jusqu'à 22 trillions d'opérations par seconde pour accélérer l'apprentissage machine. Le moteur multimédia – pour la compression/décompression - est également deux fois plus rapide. 

La puce M1 Ultra face à la concurrence x86

Si l’on remonte un peu en arrière, la puce M1 Pro offrait 8 cœurs performance, 2 autres basse consommation et un GPU avec 16 noyaux graphiques ; le M1 Max offrait 8 cœurs performance, 2 autres basse consommation et un GPU avec 32 unités graphiques. Désormais, le M1 Ultra offre le double de ce que propose le M1 Max lui-même, qui, en termes de performances, était déjà très compétitif. Si l'on reprend notre évaluation des performances du M1 Max, on peut voir que le M1 Max avec 10 cœurs était légèrement à la traîne par rapport au Core i9 d'Intel de 12e génération à 14 cœurs. Mais de vraiment pas grand-chose. De là à supposer que les performances du M1 Ultra seront doubles ? Peut-être pas littéralement, mais sûrement pas loin. Quelle que soit la manière dont on regarde les choses, le CPU M1 Ultra offre une belle avance à Apple.

Doubler théoriquement le score du M1 Max pour atteindre un score d’environ 3 000 dans ce benchmark met la barre très haut pour l'industrie du PC qui souhaiterait concurrencer le M1 Ultra. (Crédit : IDG) 

Encore une fois, dans le populaire benchmark Geekbench, un doublement des performances du M1 Max présentées ici propulserait certainement le M1 Ultra au sommet, facilement. Cependant, Apple a quelques raisons de s'inquiéter. Quand on commence à prendre en compte les performances du GPU, les tests précédents montrent que les performances du GPU du M1 actuel souffrent déjà, et qu'elles peinent trop pour rattraper probablement l'écosystème PC. Le test de performance Geekbench Compute utilise le GPU pour exécuter 11 charges de traitement comme la profondeur de champ, la détection de visage et la physique des particules. Le test utilise deux API multiplates-formes, c'est-à-dire des instructions et des protocoles convenus pour exécuter des fonctions sur différents matériels, à savoir OpenCL, Vulkan et CUDA, l'API propriétaire de Nvidia, et Metal, l'API propriétaire d'Apple. Le benchmark révèle essentiellement que le GPU intégré d'Apple pourrait être dépassé par un GPU discret, à tout moment.

Reste que, dans l'ensemble, il est indéniable que le CPU M1 Ultra est un monstre absolu, comme l'a affirmé Apple. Attendons de voir maintenant comment l'industrie du PC, et les fournisseurs de puces ARM comme Fujitsu, Qualcomm et Texas Instrument vont réagir.