Avec le Ryzen AI Halo, AMD défie le DGX Spark de Nvidia

Le Ryzen AI Halo d'AMD exécute localement de grands modèles de langage (LLM) open source et génère des images, des vidéos et de la musique, le tout sans passer par le cloud. Une réponse au DGX Spark du grand concurrent Nvidia.

Alors que les fournisseurs IA durcissent les limites d’utilisation de leurs fonctionnalités les plus puissantes et la facturation de tokens, il est tentant de compléter ou même délaisser les abonnements à ChatGPT, Claude ou Gemini en exploitant une IA locale. AMD est le dernier en date à se lancer dans la course avec un poste de travail dédié à l'IA baptisé « Ryzen AI Halo ». À première vue, il semble très séduisant : un format de la taille d’un Apple Mac Mini (Silicon M4) ou d'un Nvidia DGX Spark (Grace/Blackwell), avec un puissant processeur AMD Ryzen AI Max+ 395 (Zen 5 avec 16 cœurs et 32 threads) évolutif vers le pointu Ryzen AI Max+ 400, épaulé par un GPU Radeon RDNA 3.5 avec pas moins de 40 unités de calcul, et – surtout – 128 Go de mémoire LPDDR5x unifiée. Cette dernière spécification est la plus importante. La mémoire est essentielle en matière d’inférence IA (vous avez peut-être remarqué la pénurie actuelle de RAM), et sans RAM suffisante, votre système aura du mal à gérer les grands modèles de langage locaux (LLM) comme le GPT OSS d’OpenAI à 120 milliards de paramètres, sans parler des modèles de génération vidéo gourmands en RAM comme LTX 2.3.

Le mini-PC Ryzen AI Halo d’AMD est équipé d'une puce Ryzen AI Max+ 395 d’AMD avec 128 Go de mémoire LPDDR5x unifiée, conçu pour exécuter localement de grands modèles d’IA comme GPT et générer des vidéos. (Crédit Foundry)

Grâce à sa prise en charge de la mémoire unifiée – c'est-à-dire un pool partagé à haute vitesse de RAM système et de VRAM –, l'AMD Ryzen AI Halo de 128 Go (qui avait été initialement dévoilé en janvier lors du CES) présente un avantage crucial par rapport aux cartes GPU, qui sont limités par leurs capacités de VRAM dédiées, généralement de l'ordre de 16 Go, 32 Go ou (si vous pouvez vous le permettre) 48 Go. Cet aspect de la mémoire unifiée aide à expliquer la popularité du Mac Mini M4 d'Apple auprès des adeptes d’OpenClaw et des agents IA personnels, car le minuscule Mac Mini , toujours allumé, dispose d'un maximal de 64 Go de RAM unifiée – soit seulement la moitié de ce dont dispose l’AMD Ryzen AI Halo.

Impasse sur Cuda faute de GPU Nvidia

Bien sûr, le Mac Mini et l’AMD AI Ryzen Halo se heurtent tous deux à de sérieux obstacles en matière de GenAI en raison d’une fonctionnalité cruciale qui leur fait défaut : la prise en charge du framework Cuda de Nvidia. Abréviation de « Compute Unified Device Architecture », Cuda est l’ingrédient secret qui permet aux logiciels IA de fonctionner main dans la main avec les GPU Nvidia pour une inférence IA rapide. De ce fait, la plupart des développeurs IA adoptent une approche « Cuda first » pour leurs outils, traitant les autres architectures (comme Apple Metal et la plateforme ROCm d’AMD, qui joue un rôle équivalent à Cuda en termes de connexion des applications logicielles à ses GPU) comme un élément secondaire. Pourtant, AMD cherche à pallier ses lacunes en matière de framework avec une configuration matérielle capable d’atteindre 50 Tops pour le NPU (une mesure du débit IA théorique du processeur ; 50 Tops est un chiffre respectable) et en intégrant 40 unités de calcul pour le GPU Radeon RDNA 3.5 (une quantité impressionnante pour un circuit graphique intégré). Mais là encore, ce sont ces 128 Go de RAM unifiée qui font la différence, permettant à l’AMD Ryzen AI Halo de rivaliser avec les systèmes Spark basés sur Nvidia.

Vendu à un prix proche du DGX Spark de Nvidia, l'AMD Ryzen AI Halo se mesure ici au Mac Mini M4 d'Apple. (Crédit Foundry)

Ce qui nous amène au prix : la modique somme de 3 999 $HT, et il s’agit là du prix d’entrée de gamme pour un système équipé d’un Ryzen AI Max+ 395. (Il convient de noter qu'AMD ne fournit que les spécifications de développement pour le Ryzen AI Halo ; ce sera aux fabricants tiers de commercialiser le matériel proprement dit). La firme de Santa Clara n'a pas révélé le prix de vente des boîtiers Ryzen AI Halo équipés du processeur Ryzen AI Max+ Pro 495, une version plus performante. AMD a fait le calcul, déterminant le seuil de rentabilité pour les acheteurs du Ryzen AI Halo qui abandonnent l’IA dans le cloud, et l’entreprise affirme que ce seuil sera atteint en six mois… à condition que vous dépensiez actuellement 773 $HT par mois en services cloud. C’est une somme considérable pour l’IA pour les utilisateurs lambda, mais peut-être pas tant que ça pour les développeurs ou les petites et moyennes entreprises qui s’appuient fortement sur l’utilisation de l’IA.

Course au matériel

L'autre facteur à prendre en compte est le rythme effréné du développement de l'IA, ce qui signifie que le matériel IA ultra-performant d'aujourd'hui pourrait ne plus l'être dans, disons, deux ans. De son côté, AMD présente sa plateforme de développement IA comme un moyen pour le Ryzen AI Halo de rester dans la course dans les mois et les années à venir. Pourtant, le Ryzen AI Halo pourrait constituer une solution tout-en-un pour les petites entreprises souhaitant se lancer dans le développement de l’IA sans se ruiner, ni craindre que leur fournisseur d’IA ne leur impose des restrictions d’utilisation ou des coûts de tokens ou d’appels API exorbitants.