Cela fait des années que les clients d'Amazon ont la possibilité de déployer Hortonworks Data Platform (HDP) sur AWS, mais le nouveau service d’analyse et de traitement de données est capable de mettre en route ou d’interrompre rapidement des charges de travail ponctuelles. Comme les données résident dans Amazon S3, elles y restent toujours quand un cluster est fermé. « L’utilisation de HDP sur une infrastructure cloud as-a-service est idéale pour mieux gérer les clusters avec lesquels la plupart des gens travaillent depuis un certain temps », a expliqué Shaun Connolly, directeur de la stratégie chez Hortonworks. « Mais Hortonworks Data Cloud apporte des options de configuration différentes. Le service permet des expériences spécifiques, plus orientées vers la science et l'exploration des données, les processus ETL (Extraction, Transformation et Chargement) et la préparation des données, l'analyse et le reporting. Autant de pratiques qui peuvent tirer profit d’un savoir-faire normatif, préconfiguré, dans une solution prête à l’emploi ».

Shaun Connolly affirme que ce service cloud, qui tourne avec les solutions open source Apache Hadoop, Spark et Hive, offre des capacités de niveau entreprise, mais qu’elles font bénéficier au client des options de facturation horaire et annuelle particulières dans AWS Marketplace. Selon lui, les avantages du nouveau service sont les suivants : 

- Facilité d'utilisation d'une plateforme cloud en tant que service avec un modèle de facturation pay-as-you-go ;

- Mise en route rapide de charges de travail Apache Hadoop, Spark et Hive courantes dans le cloud ;

- Expérience normative configurée et préréglée pour les usages les plus répandus, permettant aux data scientists, développeurs et utilisateurs finaux d'être plus productifs ;

- Possibilité de consacrer plus de temps au traitement et à l’extraction de valeur des données et moins de temps à la configuration et à la mise en route de la plate-forme de données ;

Créer des datalakes dans le cloud 

« Nous proposons des applications modernes dans une architecture de données connectée afin d’offrir aux clients une expérience cohérente des données à travers le cloud et le datacenter », a encore expliqué Shaun Connolly. « Hortonworks Data Cloud for AWS est un service cloud à la demande qui fournit une expérience normative pour un usage courant de Hadoop, Spark et Hive. L’offre bénéficie du support de la communauté et permet une facturation flexible - horaire et annuelle – avec des comptes AWS Marketplace existants ».

Hier dans un communiqué, Barry Russell, le directeur général d’Amazon Web Services, Global Business Development, AWS Marketplace and Catalog Services a déclaré que « Hortonworks Data Cloud for AWS était une plate-forme Apache Hadoop open source de niveau entreprise qui permettait aux entreprises de créer des lacs de données sécurisés et de fournir les analyses qui leur permettront d’innover rapidement et en temps réel ». Il a ajouté : « Nos clients veulent des logiciels faciles à utiliser ce qui est le cas de Hortonworks Data Cloud for AWS. Le service est immédiatement disponible, et ils peuvent le déployer immédiatement sur le Marketplace ». Il a également estimé que « ce nouveau partenariat démontrait une volonté commune de livrer des applications client en temps réel et de fournir des analyses robustes qui accélèrent la prise de décision et l’innovation ».

CloudBreak mais sans containers 

Hortonworks Data Cloud for AWS est en partie construit sur la technologie CloudBreak de SequenceIQ, acquise par Hortonworks en 2015. Shaun Connolly a précisé que, même si CloudBreak avait été entièrement construit sur un modèle de conteneur, et même si Data Cloud contenait quelques conteneurs, le service n’était pas basé sur les conteneurs parce que certains éléments de la technologie ne sont pas assez solides pour les charges de travail en production. « Ils doivent avoir à la fois plus de fonctionnalités, mais être également plus sûrs et plus résistants sur le plan opérationnel », a expliqué M. Connolly. « Cela sera le cas, je pense, en 2017 ». Cette perspective laisse envisager d’autres évolutions. « C'est assez passionnant », a déclaré Shaun Conelly. « Nous voyons se dessiner un monde d'assemblages, avec des applications de données modernes construites à partir d'assemblages, plus précisément un ensemble de conteneurs reliés entre eux dédiés à des usages spécifiques. Il reste encore beaucoup à faire. Notre offre de service cloud qui permet d’effectuer très simplement les tâches les plus courantes, en est la première étape ».