Cofondée en juillet 2021 par Erfane Arwani (CEO), Pierre Crozet (CTO) et Stéphane Lemaire (CSO), la jeune pousse Biomemory s’est fait remarquer l’an dernier pour ses travaux sur le stockage ADN. Start-up au carrefour des biotechnologies et des nouvelles technologies informatiques, Biomemory entend compléter les solutions d’archivage sur bandes ou disques dans les datacenters avec son projet d’appliance de stockage longue durée reposant sur des cartouches ADN, attendue en 2030. Nous vous avions déjà parlé en novembre dernier de la technologie baptisée DNA Drive à la base de cette plateforme, à l’occasion d’une première expérimentation publique avec les Archives Nationales.

L’entreprise française n’est toutefois pas la première à travailler sur le stockage ADN, l'idée remonte à 1959 avec les travaux du physicien Richard Freynman. Depuis, plusieurs instituts de recherche (Harvard, Université de l’Arizona, Institut européen de bio-informatique, Ecole Polytechnique de Zurich…), ont présenté des expérimentations sur le sujet : encoder des données numériques en transformant les 0 et 1 en une séquence ADN constituée de quatre lettres (l'adénine A, la thymine T, la guanine G et la cytosine C) sur une bactérie. Cette dernière est ensuite lyophilisée et conservée dans une capsule métallique (fournie par Imagene) pour garantir sa conservation sur un très long terme (plusieurs milliers d’années). Pour le décodage de la séquence ADN, il convient d'ouvrir la capsule, ajouter une goutte d'eau afin de la réhydrater et de lire les informations avec un séquenceur (de 1 000 à 4 000 € HT pour les modèles portables de la société Oxford Monopore). Une autre entreprise française travaille également sur le stockage de données sur ADN : DNA Script. Nous reviendrons dans un autre sujet sur cette start-up, qui utilise un enzyme synthétique pour conserver les fichiers (plateforme Syntax).

L'ambition de Biomemory est de commercialisation en 2030 une appliance de sauvegarde avec des cartouche de stockage ADN. (Crédit S.L.)

Encodage et système de fichiers spécifiques

Pour accomplir la phase très délicate du stockage des données, Biomemory a développé son propre algorithme pour encoder les fichiers numériques vers le brin d’ADN et créé un système de fichiers proche de celui utilisé dans les disques durs pour l’allocation des données sur les plateaux. Seul bémol, une fois le brin d’ADN décodé, il n’est plus utilisable. La lecture n’est en fait possible qu’une seule fois. Et aujourd’hui, le rendement est modeste : pour stocker 200 Mo de données, il est nécessaire d’écrire sur 13,4 millions d’oligonucléotides. Une opération vraiment très longue : un mois ! Le rendement n’est donc vraiment pas bon.   

Biomemory entend changer la donne en accélérant la vitesse d’écriture sur le brin ADN avec un support réutilisable plusieurs fois, et, ce, sans utiliser de bactéries. L’entreprise reste encore très discrète sur le support qui sera utilisé pour des questions de concurrence. La technologie DNA Drive, et plus précisément son algorithme, est utilisée pour convertir la séquence obtenue en information binaire, avec un système de fichiers supportant index et métadonnées. Les fichiers pourront même être compressés si besoin et un algorithme de correction d’erreurs s’assurera de l’intégrité des données conservées. Deux brevets ont été déposés par Biomemory pour protéger tous ces développements.

L'allocation des données sur les brins d'ADN emprunte son organisation à celle des plateaux de disques durs. (Crédit S.L.)

Comme nous l’avons indiqué un peu plus haut, Biomemory n’est pas la seule entreprise investie dans le stockage ADN. La DNA Data Storage Alliance, affiliée au SNIA, regroupe déjà des acteurs comme Microsoft, Western Digital, IBM, Seagate, mais aussi Dell Technologies ou Fujifilm. Parmi les usages envisagés par Biomemory, et ses concurrents, citons le stockage de données liées aux cryptoactifs (NFT et autres monnaies virtuelles), l’archivage très longue durée et la traçabilité. Quand la technologie sera mature bien évidemment. Reste que les technologies actuellement utilisées comme la bande, les disques durs et même la flash - pour une restauration rapide -  vont encore progresser d'icic 2030. La partie va être rude.