Livrée depuis cette semaine, l'appliance Big Data d'Oracle combine étroitement la plate-forme serveur de Sun, le framework Hadoop Cloudera, une nouvelle base de données NoSQL, et le langage d'analyse statistique R. Pour détailler cette annonce et revenir sur d'autres solutions mixant matériels et logiciels présentées au dernier Oracle OpenWorld en octobre dernier à SF, le fournisseur californien nous a accueillis dans son centre technique de Linlithgow en Écosse. Anciennement dévolu à Sun, ce dernier héberge une partie datacenter et fait également office de plate-forme de tests et de validations pour les projets des clients européens. John Abel, CTO EMEA chez Oracle, est revenu sur la solution Big Data de la compagnie. Cette plate-forme a été conçue pour travailler de concert avec Database 11g, les appliances Exadata, pour le traitement des données, et Exalytics, pour l'analyse décisionnelle.

La Big Data Appliance intègre un nouvel ensemble d'outils d'Oracle baptisé Big Data Connectors qui permettent aux entreprises de déplacer les données stockées dans des environnements Hadoop vers Database 11g. Le produit a été conçu pour proposer aux entreprises un moyen de déployer rapidement Hadoop et d'autres projets NoSQL, sans avoir à se soucier du matériel, des logiciels et des questions d'intégration. C'est le credo d'Oracle depuis le lancement de la famille d'appliances caractérisées par la performance. John Abel se risque même à faire une comparaison avec l'univers automobile, les serveurs traditionnels d'Oracle, hérités de Sun, seraient comme les voitures de Mercedes, et les Exadata comme les engins supersportifs de la branche AMG du constructeur à l'Étoile.

Des offres déjà disponibles chez les concurrents

Plusieurs autres fournisseurs tels que EMC Greenplum (Data Computing Appliance), Dell et NetApp proposent des offres Hadoop similaires. Les solutions de Dell et NetApp sont également basées sur le framework Hadoop Cloudera, tandis que le produit EMC est basé sur Map R, un rival de Cloudera.

Le développement de cette appliance chez Oracle a amené d'autres compagnies à lui emboiter le pas. Selon James Kobielus, analyste chez Forrester Research, on peut s'attendre à voir ce type de produits chez IBM, Hewlett-Packard et SAP. Tous ces fournisseurs proposent déjà une solution classique pour traiter les Big Data. « C'est très bon pour le marché. Cela donne aux clients un plus grand choix de produits », pour déployer leurs projets de Big Data, a ajouté M. Kobielus . « Cela valide également le fait que le noyau initial de start-up sur ce créneau [des sociétés telles que] Cloudera et Map R sont de mieux en mieux enracinées, » dans les entreprises, a-t-il poursuivi.
Quand Oracle a annoncé son appliance en octobre dernier, beaucoup avaient annoncé que le produit exécuterait une distribution Oracle de Hadoop. Le fait que la société ait décidé d'utiliser Cloudera est significatif, a expliqué David Menninger, analyste chez Ventana Research. « Cloudera est l'un des leaders du marché en matière de distributions Hadoop, alors pourquoi se battre pour établir une autre distribution? » a ajouté M. Menninger.



Avec Cloudera, Oracle a éliminé une faiblesse potentielle

«Pour les rivaux d'Oracle, je pense que cela signifie une concurrence plus directe. Si Oracle avait créé sa propre distribution, il aurait donné aux concurrents une faiblesse potentielle à exploiter, a déclaré M. Menninger. « En choisissant Cloudera, Oracle a éliminé un problème potentiel, pour se concentrer sur les bénéfices proposés par son appliance ». De nouveaux produits Oracle sont encore attendus sur le marché du Big Data. « Le message d'Oracle au marché est qu'ils peuvent être le guichet unique pour tous vos besoins en traitement de données, avec notamment des réponses matérielles et logicielles, pour le traitement de grands et de petits volumes de données, le transactionnel et l'analytique ».

L'appliance Big Data est disponible dans une configuration rack complète avec 18 serveurs Oracle Sun X4270 M2 avec 12 coeurs Intel par noeud (soit 216 au total), 48 Go de mémoire vive par noeud (soit au total 864 Go), 648 To d'espace de stockage, et une interface InfinBand à 40GB/sec pour la connexion de plusieurs racks ensemble. Elle s'utilise en association avec la machine Exadata et la prochaine Exalytics. L'ensemble peut gérer les données structurées et non structurées dans des bases SQL ou non SQL. Pour le tarif, Oracle annonce un prix de 450 000 dollars.