Un peu plus tôt cette année, Microsoft avait présenté sa solution big data en ligne, Azure Data Lake, et ce lundi l’éditeur a étoffé cette plate-forme avec des outils de traitement et d’analyse des données un peu plus simples et accessibles. Pour accompagner ce changement, la firme de Redmond est passée par la case rebranding en rebaptisant sa solution Azure Data Lake Store, qui présente comme particularité de pouvoir stocker des données non-structurées, semi-structurées et structurées sans modification.

Les données peuvent être partagées en toute sécurité tout en restant accessibles pour le traitement et l'analyse. Des données issues de capteurs et de dispositifs liés à l'Internet des objets, d’applications mobiles ou de sites d'achats en ligne sont enregistrables sans restrictions quant à la taille du fichier.

Yarn supporté dans Azure Data Store

Disponible en bêta un peu plus tard cette année, cette solution travaille avec le système de fichiers HDFS (Hadoop Distributed File), de sorte que les distributions Hadoop tels que Hortonworks, MapR et Cloudera peuvent accéder aux données stockées pour effectuer des traitements et analyses, a déclaré Microsoft. Second point, Azure Data Lake Store est également capable de travailler avec le moteur Apache Yarn ou MapReduce 2.0.

Le service d'analyse de Microsoft exploite le langage de requêtes U-SQL, dont les capacités évolutives et distribuées permettent aux utilisateurs d'analyser plus efficacement les données dans Azure Data Lake Store mais aussi sur les serveurs SQL dans Azure, Azure SQL Database SQL et Azure SQL Data Warehouse, selon l’éditeur. Enfin, Azure HDInsight est maintenant inclus dans Azure Data Lake Store, pour offrir et gérer un service de clusters Hadoop avec des moteurs d'analyse open source, notamment Hive, Spark, HBase et Storm. Des clusters gérés sous Linux sont dès aujourd’hui disponibles avec une disponibilité de 99,9%. Les détails concernant les tarifs n’ont pas encore été divulgués.