Des problèmes d'intégration rencontrés par les fabricants de serveurs ont contraint Nvidia à retarder le lancement de son accélérateur GPU H20 axé sur l’IA, conforme aux restrictions américaines sur les exportations de puces haut de gamme vers la Chine. Pour respecter ces exigences et conserver l'accès au marché chinois, le fournisseur a mis au point trois GPU - H20, L20 et L2 - qui ne dépassent pas les limites de performance et de densité fixées par l'administration Biden. Le quotidien Digitimes, basé à Taipei, a été le premier à indiquer que ces accélérateurs destinés au marché chinois pourraient être retardés.

Selon Reuters, Nvidia pourrait livrer le H20 pas avant le courant du premier trimestre de l'année prochaine, en février ou en mars. Mais, rien ne dit que, d’ici-là, la législation en matière d'exportation n’ait pas été modifiée et que le Bureau américain de l'industrie et de la sécurité (US Bureau of Industry and Security, BIS), qui fixe les règles, ne prenne pas d'autres mesures sur les exportations de silicium de la société américaine. « Le risque que, dans les prochains mois ou trimestres, le BIS mette en œuvre d’autres sanctions pour limiter l'exportation des puces H20, L20, L2 vers la Chine, est permanent, ce qui pourrait avoir un impact sur les futurs revenus de Nvidia », a déclaré Ben Yeh, un analyste de Canalys basé à Taipei. 

Contraintes de conditionnement 

Alors que Reuters met en évidence les défis apparents liés à l'intégration technique de la puce, Ian Cutress, analyste en chef de More Than Moore, a également indiqué que le H20 était aussi confronté à des problèmes de conditionnement car il utilise la technologie très demandée Chip on Wafer on Substrate (CoWoS). Or, TSMC n’a pas prévu d’augmenter ses capacités CoWoS avant 2024.

« Pour tout matériel répondant aux dernières normes, Nvidia a la capacité d'expédier entre 10 et 100 millions d'unités, en fonction des capacités de fabrication », a déclaré Ian Cutress. « Même si le volume de conditionnement représente un facteur limitant, ce problème concerne surtout le H20, qui utilise la technologie CoWoS actuellement très demandée », a ajouté l’analyste. Cependant, selon Ben Yeh de Canalys, il y a des limites à cette demande. « Le marché des serveurs d'IA a connu une croissance extraordinaire, et cette tendance à la hausse devrait persister, mais à un rythme plus modéré par rapport aux sommets atteints en 2023. Si le secteur reste très dynamique, il est prudent de modérer les attentes pour l'avenir », a déclaré Ben Yeh. Ce rythme modéré réduirait la demande de CoWoS, créant peut-être une surabondance qui, selon le consultant pourrait finir par devenir excédentaire, car de nombreux acteurs augmentent fortement leur capacité. 

Les GPU grand public, également concernés 

En vertu des règles établies par le ministère américain du Commerce et le Bureau of Industry Security, qui mesurent la puissance totale de traitement et les données relatives à la densité de performance, les derniers accélérateurs GPU de Nvidia destinés aux datacenters et un grand nombre de ses cartes grand public haut de gamme sont interdits à l'exportation. Dell aurait restreint la vente de ses derniers GPU de la série Radeon RX 7900 d'AMD et des GPU Instinct AI et HPC à la Chine et à 22 autres pays avec lesquels les États-Unis entretiennent des relations tendues.

« Ces restrictions ont provoqué une telle pénurie de GPU dans le pays que des milliers de GPU de jeu Nvidia GeForce RTX 4090 ont été modifiés et placés dans des fermes de serveurs d'IA », a récemment expliqué Wccftech. Avant l’entrée en vigueur des nouvelles restrictions, Nvidia aurait décidé de livrer en priorité un grand nombre de cartes GeForce RTX 4090 en Chine, contribuant ainsi à la pénurie mondiale et à l'augmentation des prix. La carte, dont le prix de vente conseillé est de 1 599 $HT, se vend désormais à près de 2 000 $HT neuve et 1 850 $HT d'occasion, selon des sites web de comparaison de prix.