En direct de Las Vegas. Dans le flot des annonces sur re : Invent (du 4 au 6 décembre), celles sur la gestion des données montrent les ambitions d’AWS pour dominer  plus encore le marché du cloud public. Eléments clés de la migration vers le cloud, les bases de données sont devenues un enjeu pour les principaux fournisseurs. « Une période propice pour revoir ses services historiques et les moderniser », souligne Andy Jassy. Pour étayer son propos, il compare la migration à un déménagement où on décide ce que l’on garde ou pas. Une occasion le temps d’une photo de montrer un vieux mainframe et un carton Oracle avec l’étiquette à vendre (cf photo ci-dessous). Un tacle du nouveau monde à l’ancien !

déménagement AWS

Avec le développement des microservices et des conteneurs, le besoin en base de données ne doit pas être monolithique, « si un éditeur, vous explique que sa base de données relationnels répond aux différents cas d’usage, il faut être sceptique », glisse Andy Jassy et d’ajouter, « un couteau suisse n’est jamais la meilleure solution pour accomplir une tâche particulière ». Il milite donc pour une multiplicité des bases de données en fonction des workloads et surtout « une liberté de choix ».

AWS embarque Apache Cassandra

Le fournisseur dispose déjà d’un portefeuille varié en termes de SGBD. A l’occasion de ce re : Invent, il ajoute un service managé pour Apache Cassandra (MCS), la base de données NoSQL. Ce neuvième service SGBD était attendu et a été testé auprès de plusieurs clients comme Netflix, Openwave ou Reddit. MCS est un service serverless, les utilisateurs peuvent ainsi payer à l’usage et le service s’adapte aux évolutions du trafic des applications.

Il n’y a aucune limite de taille de table ou de nombre d’objets, le stockage s’adapte automatiquement et les tables de données sont répliquées trois fois sur différentes régions AWS. Toujours dans la sécurité, les données sont chiffrées par défaut avec des clés stockées dans KMS (Key Management Service) et MCS peut utiliser la solution IAM pour gérer l’accès aux tables et aux données. MCS est lancé en mode preview sur les régions suivantes : US East (Virginie du Nord), US East (Ohio), Europe (Stockholm), Asiae Pacifique (Singapore), Asia Pacifique (Tokyo). Il bénéficie d’un accès gratuit les 3 premiers mois dans la limite de 30 millions de requêtes (écrites et lues) par mois et de 1 Go de stockage.

Redshift épaulé par Aqua et des instances renforcées

Parmi les autres annonces liées à la gestion des données, le datawarehouse as a service, Redshift se voit adjoindre un accélérateur matériel, nommé Aqua pour les applications analytiques et de machine learning. Cette dernière sont très gourmandes en requêtes, ce qui peut provoquer des goulets d’étranglement entre les buckets S3 et Redshift. Aqua s’insère entre les deux services et fait office de cache en gérant des tâches répétitives sur du matériel dédié. Celui-ci est composé à la fois de FPGA, chargés de filtrer et d’agréger les données et le résultat est renvoyé au cluster Redshift et au système maison Nitro. Avec Aqua, qui sera disponible l’année prochaine, AWS estime pouvoir améliorer les performances des requêtes par dix. A voir maintenant si les concurrents comme Snowflake ou Yellowbrick Data pourront avoir accès à Aqua.

Enfin, pour être complet sur Redshift, AWS a dévoilé les dernières générations d’instances RA3. Elles peuvent comprendre jusqu’à 48 vCPU et 384 Go de mémoire et monter jusqu’à 64 To de stockage. Chaque instance intègre aussi le service managed storage en s’appuyant sur du SSD haute performance pour un stockage local rapide et S3 pour un stockage sur le long terme. Ce service adapte automatiquement et séparément les besoins en stockage. Ainsi, si les données d'une instance dépassent la taille du stockage SSD, Managed Storage déchargera automatiquement ces datas vers S3.