Avec la smartNIC Pensando Pollara, AMD est donc le premier fournisseur à commercialiser une carte réseau Ultra Ethernet et Oracle le premier fournisseur de services cloud à la déployer. L'annonce a été faite lors du récent événement Advancing AI organisé le 12 juin à Santa Clara, au cours duquel AMD a présenté ses derniers GPU Instinct de la série MI350 et annoncé le MI400X, qui sera livré l'année prochaine. Première carte NIC de l'industrie conforme à la spécification Ultra Ethernet Consortium (UEC) 1.0, la disponibilité de la carte d'interface réseau Pensando Pollara 400GbE a été un peu éclipsée par la masse de nouvelles. Alors qu'AMD commence tout juste à livrer la smartNIC Pollara 400 Gb annoncée en 2024, le fabricant a également annoncé une version 800 Gb de nouvelle génération, baptisée Vulcano, également conforme à la spécification UEC.
L'annonce d'AMD est intervenue quelques jours seulement après la publication par l'UEC de sa spécification 1.0 pour la technologie Ultra Ethernet conçue pour les centres de données IA et HPC. L’Ultra Ethernet Consortium a été lancé en 2023 sous l'égide de la Fondation Linux. Parmi ses membres figurent des acteurs majeurs de l'industrie technologique tels qu'AMD, Intel, Broadcom, Arista, Cisco, Google, Microsoft, Meta, Nvidia et HPE. La spécification comprend des interconnexions de GPU et d'accélérateurs, et supporte les fabrics de centres de données et les clusters d'IA évolutifs. Les cartes NIC Pensando Pollara 400GbE d'AMD sont destinées aux environnements scale-out impliquant des milliers d’accélérateurs IA.
Support de RoCEv2
La carte Pensando Pollara est basée sur un matériel personnalisable, qui prend en charge le RDMA (Remote Direct Memory Access ou Accès direct à la mémoire à distance) entièrement programmable et le contrôle de la congestion basé sur le matériel. Pollara prend en charge la communication GPU-to-GPU avec des technologies de routage intelligentes pour réduire la latence, ce qui le rend très similaire au protocole NVLink c2c de Nvidia. En plus d'être prêt pour l'UEC, Pollara 400 offre une compatibilité RoCEv2 et une interopérabilité avec d'autres cartes NIC. Lors de l'événement Advancing AI, Lisa Su, la CEO d'AMD, a présenté Vulcano, le NIC AI scale-out de nouvelle génération de l’entreprise. Vulcano est totalement conforme à la norme UEC 1.0. Il prend en charge les interfaces PCIe et duales pour connecter directement les CPU et les GPU, et offre un débit de 800 Gb/s pour se mettre à l’échelle des plus grands systèmes.
Associé au design de rack d'IA personnalisé Helios d'AMD, chaque GPU du rack est connecté via l’Ultra Accelerator Link à grande vitesse et à faible latence, tunnelisé sur un Ethernet standard. Il en résulte un système d'IA personnalisé très similaire au NVL-72 de Nvidia, où 72 GPU sont reconnus comme un seul processeur par le système. Oracle est la première entreprise à opter pour Pollara et Helios, et elle ne sera probablement pas la dernière. L’entreprise est en retard par rapport aux leaders du cloud que sont AWS et Microsoft, et elle ne détient qu'environ 3 % de ce marché.