Alors que la plupart des présentations faites autour des Big Data sous-tendent que les systèmes de traitement seront déployés dans l'entreprise, Google construit un service qui permettra d'analyser dans le cloud d'importants volumes de données. Baptisé BigQuery, ce service pourrait aider les entreprises à analyser leurs données sans avoir besoin de construire une infrastructure, a expliqué Ju-Kay Kwek, responsable produit chez Google, lors d'une intervention sur la conférence GigaOm Structure Data qui s'est tenue cette semaine à New York. Avec BigQuery, « vous pouvez concevoir des applications et partager des données sous la forme d'un service », a-t-il décrit. Ce service n'est pour l'instant accessible qu'en mode bêta privé pour quelques clients. La date prévue pour une disponibilité générale n'a pas été précisée.

Les responsables de Google ont pensé assez naturellement à ouvrir ce service parce qu'ils avaient déjà développé pour leur propre usage plusieurs des outils nécessaires à sa mise en place. « Pour commencer, indexer le web est déjà une problématique Big Data, a rappelé Ju-Kay Kwek. La société de Larry Page et Sergey Brin réalise également de nombreuses analyses sur la façon dont les internautes utilisent des services tels que la messagerie gmail. Ces données opérationnelles renseignent sur les caractéristiques qui fonctionnent et celles qui sont inopérantes. Le fait de garder toutes les données générées contribue largement au succès des analyses réalisées. « La granularité, c'est l'une des clefs », reconnaît Ju-Kay Kwek. Dans de nombreux cas, les ingénieurs de Google ne savent pas à l'avance quelles questions poser lorsqu'il s'agit de faire des requêtes sur les données. La clef, c'est de poser beaucoup de questions. Plus vous en posez dans un délai réduit, plus elles seront pertinentes, selon le collaborateur de Google.

Le Français We Are Cloud parmi les premiers utilisateurs

Les professionnels qui testent actuellement le service le font de différentes façons. Les clients peuvent charger un jeu de données, puis le mettre à jour au fur et à mesure que les données sont disponibles. Ils peuvent alors utiliser les algorithmes et le langage de requête de Google pour parcourir ces données. Les régies publicitaires utilisent le service pour collecter des informations sur les actions des internautes et des mesures pour évaluer l'audience de leurs publicités. Un autre client, un hôtel, utilise les données pour gérer ses données de gestion, associant des informations de différents systèmes financiers pour faire des projections dans le domaine de la fiscalité.
[[page]]
Recourir au modèle cloud pour les Big Data apporte plusieurs bénéfices, expose Ju-Kay Kwek. Principalement, cela supprime le besoin de mettre en place un datawarehouse. « Nous nous occupons de la plomberie ». Les fonctions de sécurité et de sauvegarde sont comprises dans le service. Autant de temps de gagné pour pénétrer au coeur des données et obtenir des résultats.

Parmi les utilisateurs de la version privée figure We Are Cloud, société française basée à Montpellier qui propose des services de Business Intelligence dans le cloud. Dénommé Bime, son service s'adresse aux PME qui ne dispose probablement pas des équipes qui leur permettraient de maintenir un système de BI en interne. Leur service de tableau de bord peut récupérer des informations de sources multiples, notamment de bases de données internes. Les clients veulent des outils pour être autonomes, a expliqué Rachel Delacour, PDG et co-fondatrice de We Are Cloud.

Des réponses pratiquement en temps réel

La société teste BigQuery pour  le proposer à ses clients. L'un d'eux, un opérateur de télécommunications situé au Moyen-Orient, a chargé 15 téraoctets de données clients qu'il peut dès lors analyser en utilisant Bime. Rachel Delacour n'a pas souhaité révéler le prix facturé par Google pour héberger les données, mais elle a indiqué que le tarif était raisonnable. Pour elle, ce mode d'utilisation est pertinent dans un environnement dynamique. « Cela vous donne pratiquement des réponses en temps réel sur de très importants jeux de données », a-t-elle confié à nos confrères d'IDG News Service à l'issue de sa présentation.


Google présente BigQuery