GTC 2026: Nvidia combine les TPU Groq 3 à ses puces Vera Rubin

En ouverture de la GTC 2026, le CEO de Nvidia Jensen Huang a annoncé l'intégration des racks d'inférence IA Groq 3 LPX, basées sur des accélérateurs de type LPU, à sa plateforme Vera Rubin. Des composants qui répondent particulièrement bien aux exigences de faible latence et de contextes volumineux des systèmes agentiques.

Le monde est arrivé à un point d'inflexion de l'IA agentique. C'est ce qu'a assuré Jensen Huang, le CEO de Nvidia, à l'occasion de sa conférence de lancement de son événement phare GTC 2026, qui se déroule en ce moment (16 au 19 mars) à San José en Californie. Pour répondre à cet enjeu, la société avait déjà lancé lors du CES de janvier l'architecture GPU Rubin et cinq autres composants clefs (CPU Vera, switch NVLink 6, smartNIC Ethernet ou Infiniband ConnectX-9, DPU BlueField-4 et switch Ethernet Spectrum-6) afin d'équiper ses serveurs Vera Rubin NVL72 pour l'IA. Fort de son partenariat à plusieurs milliards de dollars avec la start-up Groq en décembre, le fournisseur de Santa Clara annonce maintenant intégrer les accélérateurs LPU (language processing unit) et rack LPX Groq 3 de son ancien concurrent, à son écosystème Vera Rubin.

Un rack LPX Groq 3 peut contenir jusqu'à 256 accélérateurs LPU Groq 3. (crédit : DF)

Dans son intervention, le CEO a expliqué que les LPU Groq 3 pouvaient fonctionner comme un gigantesque processeur unique pour une accélération rapide et déterministe de l'inférence. Un rack LPX embarque jusqu'à 256 accélérateurs LPU, 128 Go de SRAM et dispose d'une bande passante évolutive de 640 To/s. Déployés avec des systèmes Vera Rubin NVL72, les GPU Rubin et les LPU Groq 3 optimisent le décodage en calculant conjointement chaque couche d'un modèle IA pour chaque token de sortie. Les performances par token assurent un niveau d'inférence très élevé qui conviendra pour des modèles atteignant le trillion de paramètres et des contextes à plusieurs millions de tokens. Les systèmes LPX peuvent aussi être intégrées à une infrastructure MGX (rassemblant CPU et GPU, et Spectrum-XGS Ethernet) taillée pour les usines IA Vera Rubin, également attendues au deuxième semestre 2026.

A noter par ailleurs le lancement d'un design de référence DSX AI Factory incluant une variété de bibliothèques logicielles à destination des partenaires de Nvidia. Parmi lesquelles Max-Q (optimisation de la puissance de calcul et du rendement par watt), Flex (ajustement dynamique des consommation d'énergie en fonction de la demande), Exchange (partage d'informations de calcul, réseau, refroidissement et alimentation, entre équipes IT et opérationnelles), et Sim (jumeaux numériques).

Les caractéristiques du rack Groq 3 LPX ont été annoncées ce lundi 16 mars sur la GTC 2026. (crédit : DF)

BlueField-4 STX, une infrastructure de stockage native pour l'IA

Lors de cette GTC, Jensen Huang a par ailleurs annoncé les partenaires qui vont l'accompagner pour ses lancements commerciaux, à commencer par celui de son système Vera Rubin NVL72. Du côté des OEM, on retrouve notamment Dell Technologies, HPE, Lenovo et Supermicro, ainsi que AWS, Google Cloud, Microsoft Azure, Oracle Cloud, CoreWeave, Crusoe, Lambda Nebius et Nscale pour les fournisseurs cloud. Des spécialistes IA ont également répondu présent comme Anthropic, OpenAI, Perplexity ou encore Mistral. Les CPU Vera bénéficient aussi de nombreux soutiens OEM (Cisco, Dell Technologies, HPE, Lenovo, Supermicro...).

Enfin, une autre annonce a retenu notre attention : le système de rack BlueField-4 STX, une infrastructure de stockage native pour l'IA qui étend la mémoire du GPU à l'ensemble d'un pod. Équipé de l'accélérateur réseau BlueField-4 - qui combine le CPU Vera et la carte SuperNIC ConnectX-9 -, ce système apporte une couche partagée à haut débit optimisée pour le stockage et la récupération de grands volumes de données de cache clé-valeur générés par les grands modèles et les workflows d'IA agentique. « Le système de stockage en mémoire contextuelle à l'échelle du rack Nvidia BlueField-4 STX permettra l'augmentation de performances indispensable pour faire évoluer de manière exponentielle nos efforts en matière d'IA agentique », a notamment expliqué dans un communiqué Timothée Lacroix, cofondateur et directeur technique de Mistral AI. « En proposant un nouveau niveau de stockage spécialement conçu pour les agents IA, STX est idéalement positionné pour garantir que nos modèles puissent conserver leur cohérence et leur rapidité lors du raisonnement sur des ensembles de données massifs. » Parmi les partenaires de lancement de BlueField-4 STX on trouve les OEM suivants : DDN, Dell Technologies, Everpure (ex Pure Storage), HPE, Hitachi Vantara, IBM, Minio, Netapp, Nutanix, Vast, Weka...