Cela fait un moment que Pure Storage répond aux besoins des entreprises pour leurs traitements IA. Depuis de nombreuses années, l’éditeur propose plusieurs offres pour différents besoins, en particulier Flashblade S pour les données non structurées (mode fichiers avec accès NFS, CFS et S3), et Flasharray (mode bloc) pour les bases de données vectorielles. « Nos clients n’ont pas attendu la GenAI pour faire de l’IA depuis très longtemps », nous a expliqué Gabriel Ferreira, directeur technique de Pure Storage France. Pour autant, les systèmes proposés jusqu’à présent ne répondent pas à des besoins à l’échelle des performances de traitements IA volumiques ce qui est maintenant le cas avec Flashblade Exa.
Que trouve-t'on au coeur de ce système ? Pas de grande surprise en fait puisqu’il s’agit du plus puissant des Flashblade S, le modèle 500, mais dont la particularité est de pouvoir être monté dans un cluster comprenant jusqu’à 10 châssis et dont la performance en lecture monterait jusqu'à 10 téraoctets par seconde. Mais un gros changement a été effectué côté OS : « Flashblade Exa s’appuie sur une version de Purity spécifique qui ne va gérer que les metadata et accéder par un controle plane aux data nodes », précise Gabriel Ferreira. Flashblade Exa permet en fait de dépasser les limites inhérentes d’une architecture désagrégée autour du calcul du réseau et du stockage qui ne répondait pas aux besoins de capacités de traitements IA plus ambitieux : « Trois niveaux ce n’est pas suffisant parce que dans le stockage on mélangeait la data, donc maintenant sur une architecture désagrégée à quatre niveaux on peut séparer la data des metadata, du réseau et du compute », résume Gabriel Ferreira. « Cette solution est vraiment unique, on l’a expérimenté avec de gros faiseurs qui nous ont dit que leur problème était au niveau du stockage, car ils n’arrivaient pas à alimenter les dizaines de milliers de GPU », assure Gabriel Ferreira.
L'architecture Flashblade Exa pensée par Pure Storage consacre le cluster de stockage uniquement à des fins de traitements des metadata. (crédit : Pure Storage)
Un cluster de stockage seulement pour les metadonnées
Flashblade Exa gère uniquement l’accès aux métadonnées pour une raison simple : « Les LLM deviennent de plus en plus sophistiqués, multimodaux et orientés sur du raisonnement, donc cela met la pression sur le compute et on a finalement plus besoin de traitements des metadata que des data elles-mêmes », explique Gabriel Ferreira. D’où l’idée de Pure Storage d’embarquer dans cette architecture les Flashblade Exa uniquement pour traiter les métadonnées.
« Les nouvelles solutions LLM vont surconsommer des metadata et les solutions de data platform qui existaient n’avaient pas été conçues pour prévoir cette évolution là. La limitation était donc que les metadata étaient généralement mélangées avec les data. » Pour répondre à cet enjeu, le fournisseur propose donc de stocker toutes les metadata dans un cluster Flashblade Exa pouvant contenir jusqu’à 10 châssis, avec dans chacun jusqu’à 10 lames dans lesquelles on pourra associer 4 DFM de densité différente. « C’est assez monstrueux », lance Gabriel Ferreira. Les échanges entre le cluster Flashblade Exa et le cluster de calcul se fait via de l’accès parallèle NFS. Pure Storage indique avoir établi une architecture de référence qui s’intègre en fonction des besoins clients. « Si le client a déjà des serveurs de données, le cluster Flashblade communique avec les data nodes, donc il y a un chemin de contrôle via le réseau et les données sont transmises directement au cluster de calcul, par exemple à base de DGX Nvidia, sans passer par le cluster Flashblade. »
La disponibilité générale pour l’été 2025
Flashblade Exa aujourd’hui en bêta va être lancée en disponibilité générale l’été prochain et pourra supporter des serveurs de données ayant jusqu’à 24 unités de DFM. Ce système sera présenté officiellement la semaine prochaine lors de la GTC 2025 de Nvidia. En France, de gros fournisseurs de services sont intéressés, mais aussi des laboratoires de recherche et des services gouvernementaux ayant déjà leurs propres clusters de GPU et leurs serveurs data nodes.
Pure Storage distingue plusieurs types de clients : les clients finaux aux besoins classiques, les plus grandes entreprises ayant des besoins IA plus élevés. Et puis à l’extrémité de son portefeuille les hyperscalers qui conçoivent leurs propres systèmes et utilisent ses DFM comme Meta (le nom d’un autre géant du cloud américain sera prochainement annoncé), ainsi que les factory IA et les fournisseurs de GPU as a service (CoreWeave, Fluidstack, Mistral AI...). Cette dernière catégorie est bien aussi visée par Flashblade Exa. Avec cette offre, Pure Storage vient donc concurrencer les acteurs des plateformes de données spécialisées dans le HPC et se renforce sur un créneau sur lequel il était déjà présent depuis 2018 avec Airi. En effet, depuis plusieurs années le fournisseur propose du stockage pour les DGX de Nvidia. Ils ont d'ailleurs étéparmi les premiers - avec DDN - à certifier leur baies flash pour DGX. Si le nombre de clients potentiels en France reste cependant très limité, les besoins sont bien réels selon Pure Storage : « Tous les clients qui ont besoin de performances d’ingestion sont vraiment confrontés à des limitations techniques, car ils ont beau mettre des clusters de GPU et se débrouiller au niveau du réseau et de la tuyauterie pour arriver à ce niveau de performance, sur le stockage rien ne va plus », conclut Gabriel Ferreira.
Commentaire