A l’occasion de sa GPU Technology Conference 2022 (GTC), le CEO de Nvidia, Jensen Huang, a officiellement dévoilé Hopper, l’architecture des prochaines générations de GPU à destination de professionnels. Dans ce cadre, la firme a présenté sa puce H100 qui réunit 80 milliards de transistors. C’est aussi la première à utiliser la mémoire HBM3 et à bénéficier de la 4e génération de propriétaire d'interconnexion NVLink ultra-rapide. « Nous réalisons avec Hopper notre plus grand saut technique générationnel », a fièrement déclaré M. Huang.

Ce n’est pas la première fois que Nvidia profite de la GPU Technology Conference pour présenter ses récentes architectures. Ampere, Volta et Pascal ont également été dévoilées lors de cette conférence. Et comme pour ces précédentes générations, si le H100 est fortement spécialisé pour les datacenters, comme en témoigne sa configuration matérielle riche en noyaux pour optimiser les tâches de deep learning, cela ne veut pas dire que les gamers ne pourront pas tirer parti de cette architecture Hopper très centrée sur l'IA, même si comme le suggèrent certaines rumeurs actuelles, la RTX 4080 et ses déclinaisons tourneront sur une architecture Lovelace différente. C'est d'ailleurs toujours le cas pour les GPU grand public, qui embarquent moins d'unités de traitement. Mais que peut apporter l'architecture Hopper de Nvidia à la gamme GeForce 4000 de prochaine génération ? 

Hopper passe au 4nm avec TSMC

Les GPU Turing de la série RTX 20 de Nvidia ont été construits par le fondeur taïwanais TSMC, qui fabrique également des puces pour AMD, Apple et d’autres géants de l’IT. Pour ses GPU Ampere de la série GeForce RTX 30, Nvidia avait opté pour le processus à 8 nm de Samsung. Et si leurs performances étaient monstrueuses, ils consommaient aussi beaucoup d’énergie. Pour Hopper - ou du moins pour le H100 - Nvidia est revenu chez TSMC. Sauf que cette fois, la puce est fabriquée sur une base personnalisée du processus 4N du fondeur taïwanais, en fait, un processus N5, mais plus économe en énergie. En termes d‘efficacité énergétique, les cartes graphiques Radeon RX 6000 d'AMD, basées sur le RDNA 2, ont ravi la première place à Nvidia, et la prochaine génération de ces cartes sera semble-t-il fabriquée par TSMC. Ce n'est pas une garantie - l'A100 basée sur Ampere, a également été fabriquée par TSMC, contrairement aux autres cartes de la série RTX 30 - mais les multiples rumeurs actuelles vont toutes dans ce sens.

Nvidia Hopper H100 (Crédit : Nvidia)

Le support du PCIe Gen 5 et NVLink 4

Les cartes de la série Radeon RX 5000 d'AMD ont été les premières à utiliser le PCIe 4.0, mais Nvidia est allée plus loin en prenant la pôle position du PCIe 5.0, supportés par les derniers serveurs Intel Xeon. Le H100 est le premier GPU à embarquer ce protocole d'interconnexion plus rapide, et, étant donné que les puces Core 12e génération d'Intel ont récemment apporté le support PCIe 5.0 aux PC grand public, il y a tout lieu de penser que Nvidia l'inclura dans la prochaine génération de carte GeForce 4000. Hopper marque également les débuts de la quatrième génération du NVLink, l'interconnexion à haut débit propriétaire de Nvidia. La série RTX 30 limite les configurations multi-GPU au seul fleuron GeForce RTX 3090. En supposant que Nvidia continue à offrir un support multi-GPU avec ses cartes GeForce haut de gamme, le NVLink 4 améliore la vitesse de manière conséquente. Selon Nvidia, l'implémentation NVLink 4 de la H100 fournit 900 Go/s de bande passante, contre 600 Go/s pour la A100 basée sur Ampère et un NVLink de troisième génération.

La course aux transistors relancée

Le H100 est optimisé pour les calculs intensifs dans les datacenters, et Nvidia n'a (curieusement) divulgué aucune information sur le nombre de noyaux CUDA, la vitesse d'horloge ou la taille des GPU. Difficile sans ces indications, d’avoir une idée précise des caractéristiques des futures cartes GeForce. Mais les spécifications révélées par Nvidia montrent que le fournisseur n'a pas peur de faire les choses en grand avec Hopper. Cette architecture intégrée à la carte H100 est doté de 80 milliards de transistors - un bond considérable par rapport aux 54,2 milliards de la carte A100 basée sur Ampère, et près de quatre fois plus que les 21,1 milliards de la carte V100 basée sur Volta.

Pousser ces transistors au maximum de leurs performances nécessite cependant beaucoup d'énergie. Nvidia affirme que le H100 consomme jusqu'à 700 watts, soit 300 watts de plus que la puce A100 la plus rapide. Cela ne veut pas nécessairement dire que les GPU GeForce de la série RTX 4000 seront aussi des gouffres énergétiques, mais les rumeurs actuelles suggèrent que les cartes graphiques de prochaine génération de Nvidia consommeront beaucoup d'énergie. La forte consommation de la H100 semble les conforter. Mais, il faudra attendre les prochaines présentations pour avoir confirmation ou infirmation de ces rumeurs.

Des questions encore en suspens

Lors de la présentation des architectures précédentes qui ont eu lieu dans le cadre de cette GTC 2022, Nvidia avait fourni beaucoup plus de détails sur le nombre de noyaux et la vitesse d'horloge, si bien que l’on pouvait mieux anticiper sur les caractéristiques des prochaines cartes GeForce. Les rumeurs laissant entendre que la RTX 4080 et ses déclinaisons pourraient tourner sur une architecture Lovelace différente, brouillent également les pistes. La H100 devrait faire son apparition sur le marché au troisième trimestre. Sans doute qu’il faudra attendre jusque-là pour en savoir plus sur les GPU GeForce de dernière génération.