Proposé en version preview limitée depuis le mois dernier, Kinesis est désormais disponible en version bêta publique. La vocation de ce service cloud est de traiter des flux de données en temps réel. Selon Amazon, Kinesis peut collecter et traiter de grandes quantités de données provenant de sources multiples, y compris les logs des serveurs et les flux des médias sociaux.

Les arguments du fournisseur en faveur de son service recoupent ceux de ses nombreux autres services hébergés. Dans le cas de Kinesis, AWS affirme que les entreprises n'auront pas à se soucier du provisionnement, du déploiement et de la maintenance du hardware et des logiciels pour récolter et stocker des données en temps réel. Kinesis duplique également les données récoltées sur trois datacenters régionaux, de façon à améliorer la disponibilité et la conservation des données.

Amazon voit plusieurs utilisations possibles pour son service de traitement en temps réel : par exemple, Kinesis peut récupérer des données générées par une application et s'en servir pour identifier les requêtes lentes comme les pages vues ou l'utilisation des ressources. Kinesis peut également recueillir et analyser des informations financières en temps réel ou aider les développeurs de jeux à voir comment les joueurs interagissent avec le jeu et entre eux.

Une gestion des flux sélectionnés de données

Kinesis fonctionne de la façon suivante : le service reçoit les flux de données, chaque flux étant constitué par ce qu'Amazon appelle des shards ou fragments. Chaque shard peut ingurgiter jusqu'à 1 Mo de données et réaliser 1000 transactions par seconde. En sortie, les applications liées au service peuvent lire les données de chaque shard à une vitesse de 2 Mbit par seconde. La première étape du processus de configuration consiste à déterminer le nombre de shards nécessaires. La console du service comprend un assistant pour réaliser cette opération. Si un flux n'a pas la capacité de gérer toutes les informations transmises, les données sont soit retardées soit ignorées. Le redimensionnement dynamique du flux est possible en divisant ou en fusionnant les shards en cours d'usage. Pour un flux donné, chaque changement ne prend que quelques secondes, mais on ne peut faire qu'une seule modification à la fois, comme l'explique une FAQ d'Amazon.

La bibliothèque Kinesis Client Library est un autre élément important du service. Celle-ci agit comme intermédiaire entre l'application désignée pour prendre en charge les données, et le service Kinesis lui-même. Chaque application Kinesis a un nom unique et fonctionne sur un flux spécifique. La bibliothèque cliente n'est actuellement disponible qu'en Java, mais Amazon prévoit d'ajouter le support pour d'autres langages.

Le coût de Kinesis dépend du nombre de transactions - celles-ci ne peuvent dépasser les 50 Ko - qui passent par le service et le nombre de shards utilisés. Un million de transactions coûte 0,028 dollars HT et chaque shard coûte 0,015 dollars HT de l'heure. Pour l'instant, ce service est disponible dans le territoire Est des États-Unis (Virginie du Nord) couvert par AWS.