Avec les développements tous azimuts des solutions IA génératives, les plateformes de traitement se bonifient pour faire face à cette déferlante. Si Nvidia mène aujourd’hui la danse avec ses accélérateurs GPU, elle doit également compter sur ses partenaires fournissant la cruciale partie stockage. “ L’idée est de garder les GPU actifs en leurs fournissant le flux de données nécessaire : jusqu’à 900 Gb/s en lecture et 780 Gb/se en écriture sur les SuperPod”, nous a expliqué Derek Dicker, CMO de DDN (DirectData Networks) lors d’un IT Press Tour dans la Silicon Valley début juin. Historiquement engagé sur le HPC, DDN profite de l’engouement pour les systèmes de calcul intensif DGX de Nvidia (puces Xeon et accélérateur H100 sur les derniers modèles). Le fournisseur indique avoir plus de réservations de baies de stockage IA (bloc) au premier trimestre de cette année que pendant toute l'année précédente et l'année 2022 a été très forte. "Nous sommes derrière 5 000 systèmes DGX aujourd'hui”, assure le dirigeant. “Il y a quatre ans, nous avons estimé qu’il était nécessaire de faire des investissements sur la couche logicielle, la couche matérielle et la couche d'intégration pour améliorer l'optimisation du stockage pour l’IA. Et, nous sommes en ce moment dans la seconde vague [IA]. La première a vraiment commencé avec beaucoup d'analyse d'images et de vidéos, de conduite autonome, de sciences de la vie, et bien sûr, de services financiers". DDN surfe donc toujours sur cette vague et travaille avec Nvidia et ses systèmes DGX comme nous vous l’expliquions en 2018.

“Aujourd’hui, les opportunités sont très larges, parce que ces nouveaux grands modèles de langage sont multimodaux, cela signifie qu'ils peuvent s'appliquer non seulement aux langages littéralement, mais aussi au à l'ADN, à l’image et la vidéo. L'informatique accélérée - un concept inventé par Nvidia - englobe essentiellement l'avènement des GPU pour accélérer le travail en parallélisant tout d'une manière très fine en s'éloignant des CPU. Et le calcul accéléré englobe l'idée d'une optimisation complète de la pile. Et cela signifie, que la pile s'étend dans notre cas depuis l'utilisateur final, le tableau de bord, jusqu'aux applications, en passant par les GPU, jusqu'au réseau, dans le stockage”.

Avec la déclinaison QLC de la baie A1400x2, DDN monte jusqu'à 8 Po dans 12U, et annonce des performances de 3 millions d'IOPS. (Crédit S.L.)

De la QLC pour augmenter la capacité de stockage

Parallèlement à sa collaboration avec Nvidia, qui vient de mettre à jour ses systèmes DGX avec les dernières puces Intel Xeon Sapphire Rapids tout en mettant un pied dans le cloud pour le calcul déporté, DDN met à jour l’A1400 X2, une baie de stockage flash (avec le système de fichiers parallèle Exascaler sur base Lustre) intégrant désormais des composants NAND flash QLC (4bits/cellule) en complément de la TLC (3 bits/cellule), afin de combiner vitesse et capacité (jusqu'à 1,45 Po dans un châssis 2U et 8 Po dans une armoire 12U). “ La technologie de flash à quatre cellulaires vient réduire le coût au gigaoctet par rapport à la génération précédente TLC. Donc, ici, nous avons un A1400x2, avec un contrôleur en haut, et nous prenons en charge jusqu'à cinq boîtiers d’extension QLC avec un système de fichiers parallèle. Ce qui donne quelque chose comme huit pétaoctets de stockage flash brut à un coût beaucoup plus réduit que le TLC (la moitié du prix à peu près) tout en nous assurons que les performances restent élevées pour les utilisateurs finaux en termes d'IOPS et de débits en lecture/écriture. Nous obtenons ces performances sans utiliser un réseau back-end complexe, et sans commutation externe”, assure le CMO. Si les SSD QLC sont moins rapides que les TLC, ils stockent plus de données, ce qui est très intéressant dans les systèmes HPC pour l’IA puisque de grands volumes de data sont traités pour alimenter les modèles.

DDN n'a pas renoncé aux disques durs, qui assurent encore un rapport capacité/prix/performance intéressant avec un système parallèle. (Crédit S.L.)

DDN n’est bien sûr pas le seul fournisseur à adopter la QLC sur ses baies de stockage - Pure Storage, Vast Data ou encore NetApp ont également franchi le cap - mais se démarque en tentant une percée dans le monde HPC.