Connu sous le nom de code Braga, l’accélérateur Maia 200 de Microsoft a enfin été dévoilé. Un lancement retardé selon The Information par une succession de problèmes (modification de conception, départ en cascade du personnel…). Pour rappel, la firme de Redmond avait présenté un premier accélérateur nommé Maia 100 en novembre 2023 lors d'une conférence Ignite.
Sur le plan technique, la puce Maia 200 a été conçue avec un procédé de 3 nm de TSMC (contre 5 nm pour la puce précédente) et comprend 140 milliards de transistors épaulés par 216 Go de HBM3e à 7 To/s. A noter que la société a repensé la gestion du sous-système de mémoire en intégrant 272 Mo de SRAM (mémoire statique) sur la puce, un moteur d’accès direct à la mémoire (DMA), ainsi qu’un NOC (network on chip) spécialisé pour optimiser la bande passante et la gestion des tokens. Les accélérateurs trouvent leur place dans un rack dédié intégrant la deuxième génération de système de refroidissement liquide et un backend réseau optimisé. Un cluster peut comprendre jusqu'à 6 144 accélérateurs et affiche une bande passante bi-directionnelle de 2,8 Tb/s.
Un déploiement progressif
Avec cette configuration, Microsoft estime rivaliser avec les puces IA des concurrents à savoir les TPU Ironwood de Google et les Trainium 3 d’AWS. Dans un benchmark, l’accélérateur de Microsoft fournit une puissance de calcul FP4 de 10 petaflops (contre 2,5 pour le Trainium 3, mais il n’y a aucune mesure pour le TPU Ironwood) et 5 petaflops en FP8 (contre 4,6 pour le TPU de 7e génération de Google, et 2,5 pour le Trainium 3). Dans un communiqué, il précise que les Maia 200 servent à adresser plusieurs LLM dont les derniers GPT 5.2 d’OpenAI. Par ailleurs, la division Superintelligence de Microsoft les utilisera pour la génération de données synthétiques et l’apprentissage par renforcement pour renforcer ses prochains modèles.
Les puces Maia 200 sont disponibles dès aujourd’hui pour certains clients Azure aux Etats-Unis. A date, seule la région US Central (Des Moines, Iowa) est concernée pour l'instant. D'autres régions suivront comme US West 3 (Phoenix, Arizona). A noter que Microsoft livre son accélérateur avec un SDK en preview comprenant plusieurs outils et fonctionnalités comme l’intégration de PyTorch, un compilateur Triton, un simulateur de coût, un bibliothèque de programmation,…