Face à l’augmentation considérable des données chaque année, il faudra bien trouver, à l’avenir, des alternatives à nos systèmes de sauvegarde traditionnels (disques durs), d’un côté, dont les capacités maxi atteignent aujourd’hui les 16 à 20 To et, de l’autre côté, la bande en LTO-9 pour l’archivage qui stocke de 18 à 24 To en natif/ 45 à 60 To en mode compressé). Certes, ces deniers continueront d’évoluer vers des capacités plus importantes dans les 10 ans, mais ils ne seront peut-être pas suffisants pour absorber toute cette volumétrie à venir. D’autre part, se poseront aussi d’autres, problématiques à résoudre comme l’espace physique accordé au stockage dans les datacenters, les économies d’énergie et les performances. C’est donc dans ce contexte que les ingénieurs et les scientifiques travaillent sur de nouvelles technologies dans ce secteur dont le stockage des données sur ADN qui répondrait surtout aux besoins d’archivage comme le propose la bande aujourd’hui. Comme son nom l’indique, ce dernier consiste donc à convertir des données binaires (0 et 1) et à les placer dans des brins d’ADN synthétiques. Potentiellement, cette méthode fournirait la plus haute densité de stockage. Selon un article publié dans le journal du CNRS, un seul gramme peut théoriquement contenir jusqu’à 455 exabits d’informations, soit 455 milliards de milliards de bits. Toutes les données du monde tiendraient alors dans une boîte à chaussure. De même, la durée de conservation serait de plusieurs milliers d’années.

Des avancées importantes

Les derniers travaux publiés dans le stockage ADN montrent des avancées significatives. C’est par exemple le cas de Microsoft, en partenariat avec l’Université de Washington, qui a montré, en 2020, le premier système entièrement automatisé pour stocker et récupérer des données dans l'ADN synthétisée. Derrière cette expérience, l’objectif de Microsoft est bien de mettre en production un système qui, pour l'utilisateur final, ressemble beaucoup à n'importe quel autre service de stockage dans le cloud. Reste toutefois à résoudre la problématique de la latence, la lecture et l'écriture des fichiers codés par l'ADN prennent actuellement beaucoup de temps ; de même, les taux d'erreur lors de l'écriture seraient très élevés. Hormis Microsoft et ses partenaires, d’autres expériences sont menées comme celle de la société américaine Catalog (créée par des chercheurs du MIT) qui affirme en partie résoudre les problèmes de latence grâce à son approche combinatoire permettant des réductions de coûts et des gains de débit considérables. À ce titre, Catalog ou Microsoft sont toutes deux membres de l’alliance DNA Storage, dans laquelle on retrouve Western Digital ou encore Illumnia, très avancé dans le séquençage de l’ADN. En France, le CNRS et ses partenaires européens et français dont l’Université Côte D’Azur, via le projet OligoArchive, et  des chercheurs de Sorbonne Université avec Twist Bioscience, entreprise américaine spécialiste de la synthèse d’ADN, et Imagene, entreprise française spécialiste de la conservation à long terme (encapsulation) de l’ADN. ont planché sur la création d’une capsule ADN. Les Archives nationales ont ainsi accueilli le 23 novembre dernier les premières archives numériques encodées sur ADN. Il s’agit de deux textes de l’histoire de France, la Déclaration des droits de l’homme et du citoyen (1789) et la Déclaration des droits de la femme et de la citoyenne (1791).