Depuis le déploiement de la mise à jour de sa base de données DB2, IBM met en avant les capacités de data reporting et d'analyses de son Infrastructure as a-Service (IaaS) SmartCloud. « Nous sommes le seul acteur du marché à proposer un service cloud capable d'analyser les données en temps réel », a déclaré Bob Picciano, directeur général Information Management d'IBM.

À partir du second semestre de cette année, SmartCloud commencera à utiliser la version 10.5 de la base de données DB2. L'offre devrait être disponible partout au début du mois de juin prochain. La base de données intègrera un ensemble de technologies regroupées sous la dénomination de BLU Acceleration, qui permettent d'accélérer sensiblement l'analyse des données, selon IBM. L'entreprise a également annoncé que SmartCloud pouvait désormais faire tourner des copies de la base de données in-memory HANA de SAP, pour le test et le développement pour commencer.

BLU - pour Big data, Lightening fast, Ultra easy - est un ensemble de technologies qui permettent d'optimiser la vitesse d'exécution des requêtes de DB2 dans les bases de données en mémoire. Elle offre un traitement en colonnes, où seules les colonnes nécessaires d'une table de base de données sont lues afin d'accélérer les performances. Elle ignore les données inutiles, comme les doubles entrées. Elle peut utiliser plusieurs coeurs de processeur pour exécuter une requête, en utilisant des techniques de traitement vectoriel en parallèle. Elle comprend aussi une technologie de compression qui réduit la quantité d'espace dont le jeu de données a besoin, tout en offrant un accès facile pour une analyse rapide.

Une complémentarité avec les outils de BI

Le client peut continuer à utiliser son logiciel de Business Intelligence (BI) préféré et simplement rediriger les requêtes SQL et OLAP (traitement analytique en ligne) du logiciel de BI vers le service IBM. Chaque instance DB2 de SmartCloud peut tourner sur un maximum de 16 coeurs de processeur, ce qui lui permet de gérer collectivement un téraoctet de mémoire et plus. « Il n'est pas nécessaire d'avoir beaucoup de coeurs processeurs pour profiter de ce type de parallélisme, parce que la manière dont le service utilise les processeurs et la mémoire est très efficace », a déclaré Bob Picciano.

« Grâce à cette technologie, un client peut mettre en place un système capable d'analyser les données dès leur mise en circulation », a expliqué le responsable d'IBM. D'une façon générale, les entreprises peuvent stocker leurs données dans un entrepôt de données ou, si les données sont collectées en quantité suffisante, dans un cluster Hadoop. Ensuite, elles peuvent utiliser divers outils de BI pour extraire des modèles et autres informations du set de données. IBM propose conserver les données en mémoire et de les analyser à la volée, en utilisant les mêmes outils de BI. « L'approche in-memory permet de diviser le temps des requêtes par mille », a affirmé Bob Picciano. «  Les requêtes, qui demandaient sept minutes sur un système d'entreposage de données bien connu, ne prennent plus que 8 millisecondes sur nos systèmes,» a déclaré le directeur général Information Management.

Le cloud, une plateforme idéale pour l'analyse du big data

L'approche d'IBM rejoint celle d'un certain nombre de fournisseurs qui pensent que le cloud est une plate-forme idéale pour l'analyse de données à grande échelle. C'est le cas par exemple de Google et de son service BigQuery qui traite les données en ligne. VMware, avec sa société mère EMC, viennent également de créer une filiale commune, Pivotal, pour vendre des services d'analyse de données dans le cloud. IBM propose également de faire tourner des copies de HANA de SAP sur SmartCloud, pour faire de l'analyse de données. L'entreprise n'a pas précisé si elle fournirait ses propres licences, ou si les clients devaient les acheter eux-mêmes. Un premier client de ce service est le grand magasin Globus, qui l'utilise pour suivre les ventes d'environ 800 000 articles sur une instance SmartCloud de HANA. Bob Picciano n'a donné aucune information sur les tarifs du service de base de données SmartCloud, expliquant qu'IBM travaillait avec chaque client au cas par cas.

D'autres fournisseurs de cloud ont aussi fait des annonces cette semaine. Google a réduit de 25 % le prix de son service de stockage de données NoSQL Google Cloud Datastore. Par ailleurs, Microsoft a annoncé qu'il étendait son service cloud Azure à la Chine. « Nous sommes le premier fournisseur important de cloud à franchir le pas», fait valoir l'entreprise.