Fondée en mars 2013, la start-up DriveScale a mis trois ans pour développer et commercialiser sa solution de stockage combinant une base matérielle et une pile logicielle pour fournir une architecture modulaire de type scale-out capable d’héberger des bases Hadoop. Techniquement, la proposition de DriveScale repose sur des JBOD (Just a Bunch Of Disk, autrement dit une baie de stockage sans contrôleur), avec des SSD ou des disques durs rattachés à un serveur Linux bare-metal (sans stockage) doté d’un agent DriveScale pour créer un cluster de stockage, pour MapReduce par exemple. Les serveurs et le stockage sont gérés comme des pools de ressources distincts depuis une plateforme SaaS. DriveScale propose un gestionnaire utilisé pour composer (configurer ou allouer) le stockage à un ou plusieurs serveurs et pour configurer les agents logiciels. Pour augmenter les performances, il suffit de simplement mettre à jour les contrôleurs CPU tout en conservant les mêmes racks de stockage. Les serveurs sont ici considérés comme une commodité, les versions bon marché – une boite avec des processeurs – suffisent amplement selon le directeur technique. « Les racks serveurs sont fournis par des partenaires et nous apportons ensuite la glue qui permet de tout coordonner », nous a expliqué Tom Lyon, fondateur et chief scientist de DriveScale. « Notre technologie propose en fait une plateforme cloud native avec des serveurs bon marché ».

Les clusters de noeuds sont pilotés par l'outil d'administration cloud de DriveScale. (Crédit DriveScale)

« L’équilibrage de charge peut être dynamique en fonction des besoins des applications, pas avec MapReduce toutefois mais plutôt avec Cassandra », nous a indiqué Tom Lyon, un ancien de Sun Microsystems comme beaucoup dans la start-up qui compte une trentaine d’employés. « Nous avons en fait commencé avec Hadoop et sommes même montés à 1 000 000 de nœuds avec une plateforme Hadoop/Spark en 2017 ». Aujourd’hui, la start-up supporte Kubernetes et Docker, tandis que le support de Greenplum est en cours de finalisation. Vertica devrait suivre très bientôt. « Les nœuds de containers sont gérés par Kubernetes et nous rendons les choses persistantes », a précisé Tom Lyon.

HPE Synergy en concurrent 

Les dernières mises à jour du système DriveScale ont permis d'améliorer la fonctionnalité de stockage, d'étendre la prise en charge du système d'exploitation du serveur pour construire de grandes infrastructures de données, effectuer une surveillance proactive et émettre des correctifs par le biais d'alertes en temps réel intégrées directement dans l'interface utilisateur. DriveScale compte ajouter l'analyse des performances du système et des configurations matérielles optimisées grâce à l'apprentissage machine.

Pour les composants de sa plateforme, DriveScale est totalement agnostique. (crédit DriveScale)

Les concurrents de la start-up sont à chercher du coté du cloud avec des acteurs comme AWS ou Google Cloud Platform, ou en local avec la plateforme composable Synergy de HPE. DriveScale affirme permettre de réaliser des économies allant jusqu'à 75 % par rapport à l'exécution d’applications dans le cloud public parce que, avec des centaines de serveurs, le cloud public revient très cher sur le long terme. Pour se différencier, la start-up californienne met en avant sa haute disponibilité native avec un design sans point de défaillance et la manipulation virtuelle des ressources hardware grâce à un contrôleur logiciel via un switch Ethernet 10 Gbit/s. Les racks se composent de serveurs sans stockage avec un adaptateur DriveScale (une appliance bourrée de cartes réseaux) et une JBOD connectée via un pont SAS (SSD et disques durs) vers Ethernet très rapide. Pour les tarifs, la société annonce un prix de 6 000 $HT pour l’Adapter, 2 000 $ HT annuel pour un sous-nœud et enfin 20$ HT annuel pour chaque SSD ou DD. Signalons pour conclure que DriveScale fournit en OEM Dell EMC. Un rachat à venir pour la start-up qui a déjà levé 3 M$ en 2013 et 15 M$ en 2016 ?