Fondée en 2019 et installée à San José, en Californie, la start-up Kalista.io s’attaque aux problèmes de performances des disques durs reposant sur la technologie SMR, notamment lorsqu’ils sont utilisés dans une configuration RAID. Albert Chen, CEO et cofondateur de la jeune pousse, part d’un constat très simple : « Les capacités des disques durs augmentent, mais pas les performances ». L’ancien développeur - passé par Microsoft, Western Digital et Rstor - a développé un contrôleur logiciel alternatif aux rustines des fabricants (Seagate et WD) pour optimiser l'utilisation des disques durs SMR (de type Host-Managed) dans les datacenters. Les plateaux des disques durs sont confrontés au dilemme de la densité. En effet, la limite théorique du stockage magnétique, appelée aussi limite super paramagnétique, s’établit à 1 To par pouce carré avec des enregistrements magnétiques perpendiculaires (PMR). Une augmentation de cette densité entraîne des problèmes de corruptions de données. Le procédé d'enregistrement SMR (Shingled Magnetic Recording) vient faire chevaucher les pistes d'un plateau comme les tuiles d'un toit en rassemblant des bandes de lecture et d'écriture pour gagner en capacité (1,25 To par pouce carré environ). « Cette technologie SMR apporte 30% de capacités en plus au prix d’interférences supérieures », confirme Albert Chen.

La technologie de SMR de Seagate.

La technologie SMR augmente la densité des plateaux et donc la capacité de stockage des disques durs, mais ralentit les performances des drives puisqu’une zone entière de pistes doit être lue, effacée et réécrite lorsque de nouvelles données en remplacent d'anciennes. Si le contrôleur du disque dur gère le processus de lecture/ écriture des SMR Drive-managed, une couche logicielle supplémentaire comme celle de Kalista réduit la latence en lecture et accélère le processus d’écriture sur les SMR Host-Managed. Phalanx restructure les opérations d'écriture et traduit le comportement des zones SMR en une séquence séquentielle. Kernel agnostique, la plateforme de Kalista, baptisée Phalanx Storage System, vient épauler le système d'exploitation (Linux) et les systèmes de fichiers, qui n'ont aucun aperçu ni aucune influence sur la disposition des bits qui se chevauchent en SMR et ne peuvent donc pas non plus procéder à des optimisations.

La couche logicielle Phalanx permet également aux applications d’accéder de manière totalement transparente aux ressources de stockage SMR. Phalanx fournit les interfaces pour les modes fichiers, objets et blocs pour les applications de stockage et de sauvegarde des données. Lors de la présentation de sa plateforme, à San José, Albert Chen a mis en avant des benchmarks reposants sur Fio, Hadoop et Ceph. Avec Fio Random Write, Phalanx a multiplié les IOPS par seize, et avec Ceph Rados, le débit d'écriture par dix. Les IOPS étaient 58% plus élevés avec Ceph Rados et le débit a augmenté de 19% avec Hadoop TestDFSIO en lecture. Terminons avec les améliorations à venir : Albert Chen travaille en effet sur l’optimisation du placement des données, la hiérarchisation des demandes entrantes, et l’optimisation des requêtes d'E/S pour chaque périphérique. Enfin, la maintenance des disques durs est envisagée de manière proactive pour déceler les inévitables pannes mécaniques et autres défaillances, bad blocs notamment.

Le contrôleur logiciel Phalanx de KalistaIO supporte un grand nombre d'environnements de stockage. (Crédit KalistaIO)

La solution Phalanx de Kalista se déploie sur Docker ou une VM et passe pas Samba, S3 ou NFS pour arriver jusqu’aux disques durs. La facturation s’effectue en fonction du volume de données gérées.