En direct San Francisco - Pour répondre aux besoins des entreprises recherchant de grandes capacités de stockage avec de la performance sur de nombreux fichiers - le marché du stockage NAS distribué -, la start-up française Rozo Systems pousse une solution reposant sur le système de fichiers Posix associé à des serveurs x86 standards. L’idée était de développer une plate-forme Software Defined Storage appliquée au stockage scale-out sur des serveurs traditionnels, nous a expliqué Pierre Evenou, CEO de Rozo Systems et récemment transplanté à San Francisco. Comme nous vous l’avions déjà indiqué en octobre dernier, Rozo est une start-up française fondée en 2010 par un chercheur Nantais Pierre Evenou, alors ingénieur de recherche au laboratoire IVC de l'IRCCyN (projet Mojette) et Louis Le Gouriellec, ex-directeur marketing chez Alcatel.

Pour assurer le développement de la jeune pousse, la petite équipe - 10 personnes en tout aujourd’hui - a décidé de partir à l’assaut de la côte Nord Ouest des États-Unis avec le recrutement d’un vétéran français local au poste de COO, Michel Courtoy, pour sa connaissance du marché américain. Les équipes de développements restent toutefois à Nantes pour assurer l’adaptation de la plate-forme de stockage qui n’est pas encore une solution prête à déployer. La start-up compte déjà plus de 10 mises en production et des benchmarks de sa solution réalisés par les plus grands studios en Californie.

Mojette, l’algorithme maison pour l’erasure coding

Après une levée de fonds initiale de 700 000 euros en France avec Nestadio Capital et Ouest Angels Developpement, Rozo démarre ses opérations aux États-Unis afin d’opérer un premier tour de table aux États-Unis, où beaucoup d’investisseurs s’intéressent au monde du Software Defined Storage selon Michel Courtoy. « Nous regardons à la fois les investisseurs français et américains afin de réaliser un mix intéressant comme a su le faire Scality ».

Pour revenir à la plate-forme technologique, RozoFS dispose comme d’autres d’une fonction d’Erasure Coding pour assurer l’intégrité des données stockées. « Nous assurons la protection de 5 copies de la même donnée avec une redondance de 1,5 seulement. Nous exploitons un vrai système de fichiers Posix autant que nous le pouvons avec des accès parallèle intensifs. L’erasure coding est habituellement lent, le notre - reposant sur l’algorithme Mojette issu de la transformation Radon (du nom du mathématicien Johann Radon) - a été retravaillé pour la performance. Mais l’algorithme n’est pas seulement réservé la protection des données chez nous ». La répartition des données sur le cluster est également assurée par Mojette ce qui assure un niveau élevé de performance. « Nous discutons avec des  clients d’Isilon qui veulent plus de performances et des clients de NetApp qui demandent plus de scalabilité. Dans notre monde, nous estimons qu’Isilon n’est pas rapide », annonce sans appel le COO. L’addition de nœud se fait sans interruption de service avec un maximum de 1023 systèmes. Coté performances, chaque nœud RozoFS monte à 3,5 Go/s de bande passante et un groupe de 4 nœuds assure près de 10 Go/s de bande passante agrégée.

 

L’algorithme Mojette de Rozo exploite la transformation mathématique Radon afin de garantir l’intégrité et la distribution des données sur le cluster. (crédit : Rozo)

Rozo est déjà passé à la version 2.0 de sa solution avec l’arrivée de l’erasure coding sur 128 bits - contre 64 jusqu’à présent - afin d’exploiter les ressources des derniers processeurs Xeon, et un mode objet direct grâce au support de la stack Swift d’OpenStack. La géoréplication avec un autre système Rozo est également dans les cartons. « Nous avons des clients avec au moins 2 sites qui nous demandent cette solution ». Les mises à jour 2.1, 2.2 et 2.3 - attendue en 2016 et 2017 - apporteront une indexation plus rapide, les snapshots par répertoire, une gestion plus efficace du caching SSD et un chiffrement plus véloce.

Signalons enfin que pour la commercialisation de sa solution, Rozo a retenu le modèle freemium avec une version communautaire gratuite sur GitHub (licence GPL v2) et une autre commerciale vendue en directe ou via des partenaires.