IDC prévoit que le big data connaîtra une croissance de 60% par an pour les données structurées et non structurées. Où placer toutes ces informations ? Le cloud public apporte une réponse. Des questions demeurent en ce qui concerne les services de type DBaaS (Database as a service), notamment sur la protection des données sensibles et la disponibilité des services. Malgré tout, un marché émergent de services de bases de données et des outils en mode cloud s'accélère.

Voici onze bases de données en mode cloud. Pour certains, il s'agit de SGBD SQL ou NoSQL, tandis que d'autres sont des acteurs de niche Open Source. Cette liste n'est pas exhaustive car des grands acteurs comme Oracle, HP et EMC/VMware peaufinent leurs propres offres.

Amazon Web Services
Simple DB et DynamoDB

Amazon propose divers services de bases de données basés sur le cloud, à la fois des bases de données relationnelles et NoSQL. La base de données relationnelle d'Amazon (RDS ou Relational Database System) fait fonctionner des instances soit de MySQL, d'Oracle ou de SQL Server, tandis qu'Amazon SimpleDB est une base de données sans schéma pour les petites charges de travail.

Du côté de NoSQL, Amazon DynamoDB est une base de données appuyée sur des SSD qui répliquent la charge de travail à travers au moins trois zones de disponibilité. Le CTO d'Amazon, Werner Vogels,  dit que DynamoDB est le service dont la croissance est la plus rapide dans l'histoire d'AWS.  Le fournisseur propose également une variété de services de gestion de données auxiliaires, comme son Data Warehouse Redshift, ainsi que Data Pipeline, qui permet aux utilisateurs d'intégrer des données provenant de sources multiples pour faciliter la gestion.

EnterpriseDB


EnterpriseDB se concentre sur les bases de données PostgreSQL en mode Open Source, mais son véritable titre de gloire est sa capacité à travailler avec des applications de bases de données Oracle. Avec le serveur EnterpriseDB Postgres Plus Advanced, les organisations peuvent utiliser des applications écrites pour les bases de données Oracle fonctionnant sur site avec la base EnterpriseDB, qui fonctionne dans les cloud d'Amazon et de HP. L'offre s'accompagne de réplication binaire et de sauvegardes planifiées.

Garantia Data


Garantia propose un service de passerelle pour les utilisateurs des bases de données Open Source NoSQL de Redis et Memcached in-memory dans le cloud public d'Amazon. Le logiciel de Garantia Data permet une configuration automatique de ces bases de données Open Source. Il aide les développeurs à faire monter ces outils en puissance sur plusieurs noeuds de réseau, à créer des clusters et à architecturer la solution pour de la tolérance aux pannes.

Google Cloud SQL


Le service de base de données en cloud de Google est centré sur deux produits principaux: Cloud SQL, que la firme de Mountain View décrit comme une infrastructure similaire à MySQL, une base de données relationnelle, et BigQuery, un outil d'analyse pour l'exécution de requêtes sur de grands ensembles de données stockées dans son Cloud.

NuoDB
Partie d'une feuille presque blanche avec pour ambition de réinventer la base de données relationnelle, la start-up NuoDB, anciennement connue sous le nom Nimbus DB, propose un SGBD distribué en mode cloud. La solution est multi-utilisateur, élastique et à la demande. La base de données est fragmentée en objets distribués appelés atomes. Toute modification d'un atome à un endroit est répercutée sur tous les autres emplacements contenant une copie de cet atome. L'équipe de NuoDB aime comparer le mode de fonctionnement de sa base de données au système BitTorrent dans la façon de diviser les tâches entre les processeurs disponibles tout en gardant la cohérence des données.

Enfin, à la question de savoir si la base est SQL ou NoSQL, Barry Morris écarte le sujet en indiquant que NuoDB est NewSQL et 100% ACID. « SQL serait une simple personnalisation. La base peut être NoSQL ou SQL suivant les besoins des utilisateurs, mais l'idée est avant tout de répondre aux besoins nés avec le cloud et le Big Data. Avec ces derniers, il est devenu nécessaire de penser à très grande échelle. C'est aujourd'hui l'ambition de NuoDB ».

[[page]]

Microsoft Azure
SQL Server

Microsoft utilise sa technologie SQL Server pour fournir une base de données relationnelle, permettant aux clients d'accéder soit à une base de données SQL hébergée dans son cloud, soit à des instances SQL Server placées sur des machines virtuelles. Microsoft propose également des bases de données hybrides qui combinent des données sur le site d'un client avec des données dans le cloud Azure via SQL Data Sync.

La firme de Redmond propose également un service de bases de données NoSQL hébergé dans son Cloud baptisé Tables tandis que les objets Blobs (Binary large objects storage) sont optimisés pour les fichiers multimédia comme l'audio et la vidéo.

MongoLab


Dans le monde NoSQL, il existe une grande variété de plates-formes de bases de données, dont  MongoDB. MongoLab donne accès à MongoDB chez plusieurs fournisseurs de cloud majeurs, dont Amazon, Azure et Joyent. Comme les autres services de type passerelle, MongoLab s'intègre également avec des services de Cloud de type PaaS (Platform as a service) au niveau des applications. MongoLab fonctionne soit sur des environnements mutualisés soit dédiés, ce dernier cas étant légèrement plus cher.

Rackspace
Cloud Databases

La base de données de Rackspace est livrée dans un cloud soit gérée en service hébergé via son offre Cloud Databases, qui est le nom de son produit. Rackspace met l'accent sur la virtualisation basée sur les conteneurs de ses bases de données cloud, dont il dit qu'il permet une meilleure performance du service de base de données par rapport à une exécution entièrement sur une infrastructure virtualisée.

Cloud Databases intègre également un réseau de stockage SAN et est basé sur une plate-forme OpenStack. Ce mois-ci, Rackspace a annoncé une base de données NoSQL dans son cloud avec Cloudant comme fournisseur.

SAP
HANA Cloud

Géant des logiciels SAP joue maintenant dans le cloud avec HANA, une plate-forme construite sur un usage de la technologie en mémoire. HANA complète les autres outils de la société, notamment Sybase, et est disponible dans le cloud d'Amazon. La solution inclut d'autres applications qui ne sont pas des bases de données, y compris les outils de gestion d'entreprise et le développement d'applications.

StormDB


Contrairement aux autres bases de données en mode cloud, StormDB est une base de données relationnelle qui s'exécute entièrement de manière distribuée, directement sur les serveurs, ce qui signifie qu'il n'y a pas de virtualisation de machines. Les responsables de StormDB prétendent que cela conduit à de meilleures performances et à une gestion plus simple parce que les utilisateurs n'ont pas à choisir la taille de leurs instances de machines virtuelles. Malgré ce fonctionnement directement sur le serveur, les clients partagent des grappes de serveurs, même si StormDB promet l'isolement des données des clients. La société est actuellement en version bêta gratuite.

Xeround


Xeround (prononcé Zé-ronde) est un outil de gestion pour déployer des bases de données MySQL facilement évolutives chez divers fournisseurs de cloud et de plateformes. Son logiciel permet de la haute disponibilité et de l'évolutivité et il fonctionne chez Amazon, Rackspace, Joyent et HP, ainsi que sur OpenStack et les plates-formes Citrix.