Si la capacité de stockage des SSD augmente régulièrement avec les progrès réalisés dans la fabrication des NAND flash (18 ou 36 To au format U.2 ou AIC), elle reste toujours très onéreuse au regard des traditionnels disques durs (26 To en SMR et 22 To en CRM). Le prix de la performance en écriture et lecture, mais également en temps de latence. Pour améliorer ce ration prix/capacité, des fournisseurs de baies de stockage flash comme Pure Storage, Dell, HPE ou NetApp assurent depuis plusieurs années des opérations de réduction des données. Cette dernière, qui consiste à réduire la capacité nécessaire au stockage des données à l’aide d’algorithmes de déduplication et de compression, peut améliorer l’efficacité du stockage et réduire les coûts d’exploitation. Très gourmands en ressources de calcul, ces traitements accaparent une bonne partie des cycles CPU. Une autre méthode consiste à assurer une partie de ces opérations - la compression - sur le SSD à l’aide d’un circuit dédié, complémentaire au contrôleur de base, sans passer par la case processeur central. Une approche baptisée Computational Storage Drive (CSD). Dans un avenir proche, les CSD pourraient fonctionner dans des environnements IoT comme les éoliennes. Les turbines des parcs éoliens assurent un travail difficile et solitaire, et si elles peuvent embarquer des capacités de traitement dans les SSD pour mieux contrôler le fonctionnement des pales, c’est un grand bénéfice. Les avions commerciaux pourraient également constituer un secteur de développement clé pour les CSD. Un vol transatlantique produit des téraoctets de données, et les contrôles de sécurité, pour contrôler la consommation du carburant ou réduire les turbulences, pourraient être assurés par les SSD équipés de FPGA ou d’ASIC.   

Si Samsung a commencé à proposer des produits de ce type il y a deux ans avec sa gamme SmartSSD, équipée d’un FPGA pour assurer la compression des données, la jeune pousse californienne SmartIOPS, que nous avons rencontrée début octobre à Milipitas, compte également intégrer des accélérateurs à ses SSD, tout comme son concurrent Scaleflux, qui travaille sur ce sujet depuis plusieurs années déjà. L’expertise de cette start-up fondée en 2014, que nous avons également rencontrée à Milipitas lors d’un IT Press Tour en octobre 2022, est particulièrement intéressante puisqu’elle commercialise sa troisième génération de SSD équipés d’un accélérateur de type ASIC épaulé par une puce ARM. En 2018 et 2020, pour sa première et seconde génération de SSD, Scaleflux avait misé sur des FPGA Xilinx pour accélérer les applications et optimiser les ressources de l’infrastructure dans les datacenters, nous a expliqué en introduction Hao Zhong, CEO et cofondateur de Scaleflux. « Une vague qui a commencé avec le réseau et les SmartNIC pour aider à gérer le trafic réseau, en déchargeant le processeur central des calculs intensifs nécessaire pour gérer les paquets et autres besoins en routage […] Et nous nous sommes demandés si la prochaine vague ne pouvait pas être dans le stockage. Nous pensions en effet que le stockage est un excellent endroit pour distribuer davantage le traitement parce que plus vous pouvez faire le traitement près de l’endroit où vivent les données. Moins vous avez à déplacer les données, plus le système global sera efficace ».

Les SSD de 3e génération de Scaleflux sont disponibles avec les formats U.2 (2,5 pouces), AIC et E1.S. (Crédit Scaleflux)

Les FPGA restent complexes à utiliser 

Mais le challenge était trop compliqué avec les FPGA, nous a expliqué JB Baker, vice-président marketing de Scaleflux. « Nous avons lancé le premier produit en 2018, la deuxième génération en 2020, la troisième génération à l’instant. Les deux premières générations étaient basées sur des FPGA et elles avaient un pilote Scaleflux. Nous étions en train de comprendre l’arène du stockage et quelles fonctions allaient être nécessaires et comment les gens pourraient les consommer. Et dans ces deux premières générations, nous avons pu montrer des avantages massifs dans certaines applications. Mais Les FPGA sont très complexes à programmer. Nous avons fait des développements conjoints avec Ali Baba et obtenu une réduction de 90% du trafic réseau, une amélioration de fois 10 et des requêtes par seconde pour leur système hybride de traitement analytique transactionnel. C’est fantastique, mais on ne peut pas l’utiliser pour quelqu’un d’autre ». 

Le SoC SFX 3000 de Scaleflux équipe la dernière génération de SSD avec compression et chiffrement. (Crédit S.L.)

Cibler des marchés de niche n’est pas une bonne façon de construire une entreprise qui compte grandir, a expliqué le responsable marketing. « Avec la deuxième génération [de SSD], nous avons commencé le pivot et, avec la troisième génération, nous avons en quelque sorte terminé ce pivot pour faire un produit facile à utiliser avec une fonction dédiée au stockage : la compression qui est largement applicable et ne nécessite aucune intégration pour que les gens en profitent ». Scaleflux a simplifié son approche avec un SSD équipé d’un circuit ASIC maison avec un puce ARM : un SoC donc qui assure les fonctions de contrôleur SSD, de compression et de chiffrement. « Nous avons commencé avec un FPGA, dans lequel vous pouvez utiliser des cœurs ARM, de sorte que les cœurs ARM sont dans le FPGA, puis dans l’ASIC ou la puce SoC », explique le responsable marketing. « Nous proposons une solution clé en main dans laquelle vous branchez le lecteur dans le même emplacement avec les mêmes pilotes que ceux que vous utiliseriez pour n’importe quel autre SSD NVMe et obtenez de meilleures performances, une meilleure endurance, réduisez votre infrastructure globale. Maintenant, nous avons toujours les ressources programmables, mais vous savez, les organismes de normalisation évoluent très, très lentement. Et donc c’est toujours en cours pour permettre à toutes ces normes d’être en mesure de mettre ces programmes dans les lecteurs. Nous avons trouvé un moyen de créer une API standard pour parler aux ressources dans les lecteurs. Mais, oh mon dieu, ça introduit un nouveau risque de sécurité. Donc maintenant, il y a un groupe qui travaille avec la concurrence à surmonter les défis de sécurité ».  La dernière puce de Scaleflux, la SFX 3000 (voir illustration) équipe ses SSD aux formats E1.S, U.2 et AIC (4 et 8 To bruts). « Nous avons tout mis dans une seule puce. Il n’y a pas d’architecture avec deux puces, qui gaspille de l’énergie et limite la quantité de flash que vous pouvez mettre dans le SSD. Nous avons adopté le pilote NVMe standard, il n’y a donc pas de logiciel que vous devez installer. Il n’y a pas de pilote personnalisé ».

Cette carte SSD AIC de première génération est équipée d'un accélérateur FPGA pour compresser les données et optimiser les ressources de stockage. (Crédit S.L.)

Avec ou sans chiffrement

La gamme de Scaleflux se compose de trois modèles : le CSD 2000 (4 et 8 To bruts en PCIe 3) doté d’un FPGA Xilinx Alveo, et les CSD 3000 et NSD 3000 (3,48 To et 7,68 To en PCIe 4) animés par le SoC SFX 3000 combinant un ASIC avec des cœurs ARM. Comme vous pouvez le voir dans le slide ci-dessous, tous les SSD assurent la compression des données en 4K principalement, alors que le chiffrement est réservé aux produits CDS 3000 et NSD 3000. Et, la principale différence entre ces deux derniers réside dans la fonction Capacity Multiplier du premier qui permet de stocker davantage de données par Go de support NAND.  « Nous proposons deux versions différentes du SSD. Si vous voulez tirer parti de la compression pour obtenir une capacité étendue et économiser sur les coûts de stockage, vous avez le CSD 2000. Ensuite, nous avons le CSD, qui permet d’utiliser la fonction de multiplicateur de capacité, et si vous ne voulez pas essayer de gérer la capacité étendue, mais que vous voulez quand même bénéficier des avantages de l’endurance et des performances, nous avons le NSD, qui est davantage axé sur le prix, avec un alignement du tarif sur les SSD hautes performances » , nous a indiqué JB Baker.

La gamme de SSD avec accélérateurs FPGA ou ASIC chez Scaleflux. 

« Nous avons intégré la compression et le chiffrement de manière transparente dans le SSD. Le cryptage est une de sorte de fonction de base pour les lecteurs d’entreprise. La compression est donc le principal facteur de différenciation. Et cette compression se fait automatiquement lorsque vous envoyez des données sur le lecteur. Vous voyez donc le SSD comme un périphérique de stockage en mode bloc. Envoyez vos données, nous les compressons avant de les ranger. Et quand vous lisez les données en retour, on décompresse et on vous envoie les données originales. C’est ce que nous appelons la transparence parce que vous n’avez aucune autre action à entreprendre », rapporte le dirigeant. Scaleflux annonce un taux de compression maximal de 2:1 ce qui pousse théoriquement les SSD à 7,68 To pour les modèles 4 To et 15,36 To pour les 8 To. « Avec une base de données, le gain est important avec la compression. Avec une vidéo, des images – déjà compressées - ou des données chiffrées, le ratio passe à 1.2. La raison pour laquelle c’est 1.2 est qu’il y a toujours des métadonnées. Donc, même si votre JPEG ou votre MPEG est un type de fichier hautement compressé, il y a toujours des métadonnées à compresser […] Avec les bases de données, ce que nous voyons, c’est que les données sont généralement compressibles dans une proportion de 2 :1 et 5 :1. Donc MySQL, Postgres sont vraiment tous dans cette gamme de trois à quatre pour un. La compression est très typique, pas garantie, parce que, vous savez, tout dépend des données. La base de données Aerospike a tendance à être très fortement compressible. C’est une base de données très haute performance, construite autour de flash. Elle est utilisée pour la détection des fraudes, les transactions en ligne ou les opérations financières et aussi comme base de données frontale pour certaines applications big data », explique JB Baker. « Et puis le stockage cloud en mode bloc comme EBS peut être également être très compressé ».

Scaleflux ne travaille pas en OEM, mais livre ses SSD avec les serveurs de Dell, HPE (avec les Superdome) ou Lenovo. Parmi les clients de la start-up, citons Ali Baba, Tencent, mais aussi Dreamworks, T-Mobile, Playtika ou encore Nvidia. Pour sa prochaine génération de produits, la start-up compte bien sûr adopter l’interface PCIe 5 et sa déclinaison CXL, et augmenter la capacité de stockage brut de ses SSD.