Selon une étude de Google sur l’utilisation intensive de SSD et des disques durs SAS dans ses datacenters, la fiabilité des premiers est moins bonne qu’annoncée. Ce rapport présenté par Bianca Schroeder lors de la 14conférence Usenix à Santa Clara en février dernier souligne que si les SSD ont envahi les centres de calcul ces dernières années, leur fiabilité sur le terrain est très différente de celle mesurée en laboratoire. L’étude de Google porte sur des millions de jours de production avec dix modèles différents dotés des technologies MLC, eMLC et SLC sur une durée de six ans dans les datacenters du groupe.

Certains conclusions de ce rapport sont particulièrement inattendues comme par exemple : « Nous ne voyons aucune preuve que les SSD les plus haut de gamme en SLC sont plus fiables que les unités MLC pour la durée de vie typique de ces produits ». La comparaison avec les lecteurs traditionnels de types disques durs est également intéressante puisque Google souligne que les unités flash ont un taux de remplacement significativement plus bas dans le domaine, mais avec un taux d’erreur très supérieur.

La technologie CTF fait mieux avec la 3D NAND

Les SSD sont équipés de contrôleurs et de dizaines de mémoires NAND flash. Selon les experts de Google, la durabilité se détériore et les bloc défectueux se multiplient quand la lecture et de l'écriture ont été répétés des dizaines de milliers de fois dans une mémoire flash NAND MLC. Les cellules qui affichent ces bad blocks perdent donc leurs données. Selon Google, un système de stockage flash connaît beaucoup moins de pannes qu’une baie avec des disques durs mais le taux d’erreur binaire est plus élevé. Le rapport de Google ajoute que ce problème est plus fréquent dans les produits NAND qui ont une structure de grille flottante Mosfet.

Samsung Electronics, qui est un des plus grands fournisseurs de NAND dans le monde, a justement adopté la technologie CTF (Charge Trap Flash) pour améliorer la fiabilité des ses composants 3D NAND et faire face à ce problème bien connu et jusqu’à présent géré par des algorithmes qui déplacent la donnée pour assurer sa redondance. Développée à l’origine par AMD et Fujitsu, la fabrication en FCE, également utilisée par Toshiba, permet de conserver un signal électrique dans une couche non-conductrice (du nitrure de silicium en lieu et place du silicium polycristallin) afin d’assurer une stabilité plus élevée que la structure de grille flottante Mosfet.

Indispensable back-up 

L’avis de Google est particulièrement intéressant quand on sait que les fournisseurs de baies flash se multiplient et rivalisent d’ingéniosité - avec notamment l’adoption de l’interface NVMe – pour augmenter les performances en IOPS et réduire la latence qui est passée sous la microseconde. Si les baies flash sont donc désormais incontournables pour accélérer les applications en production, la sauvegarde sur disques durs, cartouches optiques, sur cassettes à bande ou dans le cloud est toujours recommandée.