Pour mettre un peu de rigueur dans le monde sauvage du big data, Hewlett-Packard livre un pack qui va permettre aux entreprises de connecter le moteur de sa base de données analytique Vertica à des systèmes Hadoop pour traiter leurs masses de données non structurées. « Nous associons le meilleur des deux mondes », a affirmé Jeff Healey, directeur du marketing produit pour les plates-formes de données big data de HP. « Nous installons dans l'infrastructure Hadoop un moteur SQL dont l'efficacité n'est pas à démontrer avec lequel il est possible de voir et d'explorer les données Hadoop sans avoir besoin de compétences supplémentaires », a-t-il ajouté. Le pack HP Vertica for SQL on Hadoop peut travailler avec les distributions Hortonworks, MapR et Cloudera et avec des systèmes Hadoop classiques éventuellement développés en interne. « HP a constaté que près de la moitié de sa clientèle Vertica souhaitait aussi utiliser Hadoop », a déclaré Jeff Healey. Le pack va permettre d'utiliser Vertica comme un front-end pour analyser les données stockées dans les déploiements Hadoop. La plate-forme Vertica Analytics Platform est un système de base de données orienté colonne conçu pour exécuter rapidement les travaux d'analyse à grande échelle. Elle peut classer les requêtes écrites en SQL, un standard reconnu par la plupart des outils d'administration de bases de données et de BI de tierce partie. Le moteur Vertica « est très fiable et il peut apporter la stabilité recherchée aujourd'hui par les entreprises », a déclaré Ignacio Hwang, chef de produit senior de HP.

Le pack de HP est en partie composé de Flex Zone, qui peut être utilisé pour explorer directement les données non structurées avec SQL sans avoir à passer par une phase de cartographie de l'information. Les clients peuvent également utiliser le pack pour importer des données sélectionnées depuis Hadoop et les analyser plus rapidement dans Vertica lui-même. Mais HP n'est pas le premier à proposer du SQL pour Hadoop, et les offres concurrentes sont nombreuses. C'est le cas par exemple des solutions Open Source Apache Hive, Impala de Cloudera (également Open Source), BigSQL d'IBM et Hawq de Pivotal, pour ne citer que celles-là. Le service de recherche d'emploi Snagajob a été l'un des premiers à utiliser la technologie. Grâce au logiciel, des millions de visiteurs du site web peuvent rechercher chaque jour un emploi dans la base des 400 000 offres listées régulièrement par l'entreprise. HP Vertica Analytics Platform est disponible dès maintenant. L'éditeur n'a pas donné de prix pour sa solution, indiquant seulement que le tarif serait calculé sur la base du nombre de noeuds utilisé.