L'offre High Storage EC2 confirme l'intérêt d'Amazon Web Services pour le marché des big data. Donnant un accès rapide à de grandes quantités de données, elle permettra de traiter des tâches d'analyse intensives requises notamment par la gestion des fichiers log ou les applications de datawarehouse, indique AWS qui donne aussi en exemple l'analyse sismique.

High Storage repose sur une architecture de fichiers en parallèle qui permet de déplacer les données de et vers plusieurs disques à la fois, ce qui accélère les débits. « Les instances High Storage fournissent une densité de stockage par instance proportionnellement plus élevée, et sont idéales pour les applications à haute performance séquentielle I/O mettant en oeuvre de très grands ensembles de données », décrit AWS dans les documents marketing mis en ligne pour présenter le service. Selon l'hébergeur, High Storage EC2 vient compléter le service Elastic MapReduce, qui fournit une plate-forme pour l'analyse massive de données sous Hadoop. AWS utilise elle-même les instances High Storage pour faire tourner son service d'entreposage de données Redshift.

Neuvième type d'instance de traitement

Chaque instance AWS est constituée d'un ensemble d'unités de calcul, de mémoire, d'unités de stockage et d'autres services configurés pour répondre à un type particulier de charge de travail. Par exemple, AWS propose des instances optimisées pour l'usage de processeurs graphiques GPU ou pour le calcul haute performance HPC.

High Storage est le neuvième type d'instance créé par AWS. Elle dispose de 35 unités de calcul EC2 (ECU), de 117 Go de mémoire de travail et d'une capacité de stockage de 48 To maximum, répartie entre 24 disques durs DAS (Direct Attached Storage). La répartition des données sur plusieurs disques permet accélérer le transfert de données parce que la vitesse de lecture et d'écriture sur un seul disque n'est plus un goulot d'étranglement. Le système affiche une performance séquentielle I/O de plus de 2,4 Go par seconde.

Les clients peuvent activer les instances High Storage à partir de l'AWS Management Console, des lignes de commande EC2 ou MapReduce, à partir du SDK AWS ou de bibliothèques tierces. Les instances High Storage EC2 sont actuellement disponibles sur la côte Est des États-Unis et seront proposées dans d'autres parties du monde dans les prochains mois. Elles peuvent être achetées à la demande ou réservées à un coût réduit. Pour les utilisateurs potentiels de services Big data, le fournisseur a également rendu son service Data Pipeline accessible à tous, comme il l'avait annoncé le mois dernier.