Alors que la plupart des présentations faites autour des Big Data sous-tendent que les systèmes de traitement seront déployés dans l'entreprise, Google construit un service qui permettra d'analyser dans le cloud d'importants volumes de données. Baptisé BigQuery, ce service pourrait aider les entreprises à analyser leurs données sans avoir besoin de construire une infrastructure, a expliqué Ju-Kay Kwek, responsable produit chez Google, lors d'une intervention sur la conférence GigaOm Structure Data qui s'est tenue cette semaine à New York. Avec BigQuery, « vous pouvez concevoir des applications et partager des données sous la forme d'un service », a-t-il décrit. Ce service n'est pour l'instant accessible qu'en mode bêta privé pour quelques clients. La date prévue pour une disponibilité générale n'a pas été précisée.

Les responsables de Google ont pensé assez naturellement à ouvrir ce service parce qu'ils avaient déjà développé pour leur propre usage plusieurs des outils nécessaires à sa mise en place. « Pour commencer, indexer le web est déjà une problématique Big Data, a rappelé Ju-Kay Kwek. La société de Larry Page et Sergey Brin réalise également de nombreuses analyses sur la façon dont les internautes utilisent des services tels que la messagerie gmail. Ces données opérationnelles renseignent sur les caractéristiques qui fonctionnent et celles qui sont inopérantes. Le fait de garder toutes les données générées contribue largement au succès des analyses réalisées. « La granularité, c'est l'une des clefs », reconnaît Ju-Kay Kwek. Dans de nombreux cas, les ingénieurs de Google ne savent pas à l'avance quelles questions poser lorsqu'il s'agit de faire des requêtes sur les données. La clef, c'est de poser beaucoup de questions. Plus vous en posez dans un délai réduit, plus elles seront pertinentes, selon le collaborateur de Google.

Le Français We Are Cloud parmi les premiers utilisateurs

Les professionnels qui testent actuellement le service le font de différentes façons. Les clients peuvent charger un jeu de données, puis le mettre à jour au fur et à mesure que les données sont disponibles. Ils peuvent alors utiliser les algorithmes et le langage de requête de Google pour parcourir ces données. Les régies publicitaires utilisent le service pour collecter des informations sur les actions des internautes et des mesures pour évaluer l'audience de leurs publicités. Un autre client, un hôtel, utilise les données pour gérer ses données de gestion, associant des informations de différents systèmes financiers pour faire des projections dans le domaine de la fiscalité.