En plus d'un ensemble déjà considérable d'offres dans le cloud, Amazon propose un service hébergé de datawarehouse appelé Redshift qui se présente comme une alternative moins coûteuse aux déploiements sur site. « Quiconque a déjà utilisé un datawarehouse traditionnel sait que c'est très cher et compliqué à gérer », a déclaré Andy Jassy, vice-président d'Amazon Web Services, qui a annoncé cette offre lors de la conférence AWS re:Invent organisée cette semaine par l'entreprise à Las Vegas. Par opposition, selon le porte-parole, Redshift représenterait environ le 10ème du coût d'un entrepôt de données traditionnel. Il a précisé que l'offre automatisait le déploiement et l'administration et fonctionnait avec les principaux outils de business intelligence du marché.

Une préversion limitée du service est actuellement disponible. Amazon a indiqué qu'il commercialiserait la solution début de 2013. Redshift fonctionne avec un certain nombre d'applications de business intelligence, dont celles de MicroStrategy, SAP, IBM et Jaspersoft. Les utilisateurs devront utiliser l'un de ces packages décisionnels pour analyser les données d'Amazon dans le cloud, en utilisant les pilotes de PostgreSQL, aux côtés des APIs ODBC (Open Database Connectivity) et JDBC (Java Database Connectivity).

Un coût annuel de 1 000 $ par téraoctet


Les utilisateurs peuvent stocker jusqu'à 1,6 pétaoctet, à travers des noeuds de 2 ou 16 de téraoctets, et ce jusqu'à 100 noeuds. Les données seront stockées dans un format en colonnes afin « d'accélérer les requêtes », a souligné Andy Jassy. Amazon proposera le service sur une base de facturation pay as you go, ou pour un taux légèrement moins cher en réservant le service à l'avance. Les prix démarrent à 0,85 $ de l'heure pour les requêtes ad-hoc et seront déclinés à partir de là pour une plus grande utilisation. Dans l'ensemble, le service pourrait coûter 1 000 $ par an par téraoctet de données, par rapport à un coût moyen annuel de 19 000 à 25 000 $ par téraoctet pour maintenir des opérations d'entreposage des données en interne, a fait remarquer le vice-président d'Amazon Web Services.

Amazon n'est pas le seul service à offrir des outils de datawarehouse en mode cloud. Google donne également la possibilité de stocker de grandes quantités de données structurées à des fins d''analyse grâce à son service BigQuery. Récemment, le fournisseur de logiciels de BI Tableau Software a publié un connecteur qui permettait à ses clients de travailler avec BigQuery grâce à sa propre solution.

Redshift rejoindra le nombre croissant des offres d'Amazon, qui, au dernier décompte, s'élevaient à 158, selon Andy Jassy. Elles se composent de services de stockage, puissance de calcul, bases de données, recherche, e-mail, distribution de contenu, mise en cache et équilibrage de la charge de travail.