Pourquoi s'en remettre à un centre de données alors que l’on peut exécuter des modèles IA complets, généralement disponibles dans le cloud, sur un poste de bureau ? C'est l'argument avancé par Dell avec ses dernières stations de travail Pro Max (anciennement Precision), dont l'un est équipé d'un GPU musclé et peut exécuter des modèles IA comportant en théorie jusqu’à mille milliards de paramètres. Taillée pour les développeurs et autres data scientists, cette sorte de super DGX Spark baptisée Pro Max GB300 chez Dell est équipée de la puce Grace Blackwell Ultra GB300 de Nvidia - CPU avec 72 cœurs Armv9 Neoverse V2 et GPU avec deux dies Blackwell reliés par une interconnexion NV-HBI avec 640 coeurs tensor - un combo déjà utilisé dans les serveurs DGX pour exécuter certains des modèles d'IA les plus exigeants. « Une petite entreprise pourrait charger un modèle Kimi K2.5 d'un billion de paramètres sur le GB300 ! », a affirmé Charlie Walker, responsable produit chez Dell, lors d'une présentation.
Le Pro Max GB300 arrive alors que de plus en plus de technologies IA sont conçues pour fonctionner sur des postes de travail avec des outils comme Ollama et AnythingLLM et que les entreprises cherchent à réduire leurs coûts liés au cloud. Par exemple, la technologie d'IA OpenClaw est capable d'exécuter des agents pour automatiser des tâches sur PC, tout en coordonnant ces tâches avec de grands modèles de langage (LLM) basés sur le cloud. Nvidia a en quelque sorte détourné sa puce GB300 pour l’intégrer dans une station de travail et en faire un super DGX Spark. Et comme le calcul IA repose sur des tokens, les entreprises peuvent réaliser des économies, car la génération de tokens coûte nettement moins cher sur les postes de travail que dans le cloud. « Il faut considérer la génération de jetons comme une source de revenus pour l’entreprise : il faut la sortir [du cloud] et la mettre à disposition sur le bureau », a déclaré M. Walker.
496 Go de RAM et 252 Go de VRAM
Cependant, ces performances impressionnantes en IA ont un inconvénient : le Pro Max GB300 est un monstre de 1 600 watts, ce qui signifie que les factures d’électricité seront plus élevées. Dell n’a pas communiqué le prix de ce PC de bureau, mais il coûtera cher : CDW, le fabricant américain d’ordinateurs, propose une station de travail MSI GB300 à 97 000$ HT. Nvidia est à la pointe du développement des postes de travail dédiés à l’IA, dont les GPU sont commercialisés par l’intermédiaire des fabricants de PC. Le Pro Max GB300 est livré avec 496 Go de RAM LPDDR5X au format SOCAMM2 pour la partie CPU et 252 Go de mémoire HBM3e pour le GPU. Précisons que ce Pro Max GB300 est livré avec le DGX OS de Nvidia, une distribution Linux basée sur Ubuntu 24.04 LTS. Le fournisseur de Santa Clara propose déjà une station de travail IA à 3900€ HT appelé DGX Spark, qui dispose d’un GPU moins performant. Ces stations de travail « permettent aux développeurs d’installer un terminal sur ou sous leur bureau en ayant pleinement confiance dans la sécurité, l’accès et le contrôle des données », a déclaré Chris Marriott, vice-président des plateformes d’entreprise chez Nvidia, lors d’une conférence de presse. « Les ordinateurs de bureau constituent un excellent terrain d'expérimentation, car les développeurs peuvent y affiner leurs modèles avant de les déployer dans le cloud », a ajouté M. Marriott.
« Développer des modèles d'IA ne se résume pas à entrer des invites et à obtenir une réponse », a précisé M. Marriott. Certaines tâches d'IA peuvent s'exécuter pendant des semaines, voire des mois, en particulier lorsque des agents comme OpenClaw communiquent entre eux et que des entreprises exécutent du code. Les tâches plus longues génèrent davantage de jetons, de sorte que les PC desktop peuvent servir de bac à sable pour tester les agents avant de déployer les modèles de production dans le cloud. Les flux de travail des agents peuvent également être testés par rapport aux modèles dans le cloud. « Lorsque l’on exécute des agents, en particulier pour le déploiement d’agents en production, on souhaite toujours avoir le plus haut niveau d’intelligence possible, que ce soit en termes de performances ou de coût, car on leur confie des missions de longue durée », a expliqué M. Marriott. Dell n’a pas annoncé de date de livraison pour le Pro Max GB300, mais l’entreprise a indiqué que certains exemplaires étaient déjà entre les mains d’un client.
Un autre usage pour les GPU
L'annonce a été programmée pour coïncider avec la GTC 2026 de Nvidia, du 16 au 19 mars à San José en Californie. Même si l'IA sur les ordinateurs de bureau est déjà possible, notamment avec les cartes graphiques de jeu, la puce GB300 est explicitement conçue pour l'IA, et non pour les jeux. L'engouement précédent autour des PC IA était axé sur les ordinateurs portables, qui contribuent à améliorer les fonctionnalités des PC. « La pertinence du nouvel ordinateur de bureau de Dell s'explique par le fait que le traitement de l'IA s'étend à davantage d'appareils IT en dehors des centres de données », a souligné Jack Gold, analyste principal chez J. Gold Associates. « Même si cette technologie en pleine évolution a fait son apparition avec les grands modèles de langage (LLM) sur les serveurs, l'IA se déplace de plus en plus vers la périphérie avec l'inférence et les petits modèles de langage », a ajouté M. Gold. Malgré tout, le cloud restera un pilier des applications IA d'entreprise. Les modèles sont efficacement pris en charge par des serveurs cloud hybrides, qui offrent plus de puissance de calcul pour faire évoluer les infrastructures IA.

Commentaire