En combinant Hadoop/HDFS, Autonomy, Vertica, Enterprise Security ArcSight et des apps dans un ensemble baptisé HAVEn, HP apporte une plate-forme marketing capable d'aider les entreprises à mieux analyser leurs données structurées et non structurées à l'intérieur et à l'extérieur de leur système d'information. Comme nous l'a expliqué lors d'un entretien Franck Mong, vice-président en charge des solutions de sécurité chez HP, l'objectif est de fournir une plate-forme combinant le savoir-faire de la compagnie avec ArcSight ESM pour collecter tous les logs internes au SI, Autonomy IDOL pour récupérer les données circulant sur les médias sociaux (blogs, forums, réseaux sociaux...) pour les stocker dans une base HDFS et analyser au final avec le moteur de Vertica. Comme pour Radian6 chez Salesforce, Breeze chez Microsoft ou encore Social Media Analytics chez IBM, l'idée est de dresser ou de compléter des profils en fonction des centres d'intérêts des clients des entreprises. Un constructeur automobile qui désire savoir quand un client envisage de changer de voiture pour lui proposer une offre très ciblée ou une firme qui désire mesurer l'impact - négatif ou positif - d'une nouvelle politique tarifaire. 

Si les produits logiciels de HP participent à la collecte des données, ils n'échappent pas à la législation en vigueur relative à la protection de la vie privée. Moins sourcilleux que les Européens sur ces sujets, Franck Mong botte en touche en demandant si les réglementations en vigueur en Europe sont bien respectées par les équivalents de la NSA [la DGSE en France par exemple]... Une question loin d'être anecdotique alors que le scandale PRISM - le fameux programme US-984XN - n'en finit pas d'éclabousser les géants du web et les sociétés de services travaillant pour le gouvernement US comme Booz Allen Hamilton (BHA). Le big data inquisiteur du gouvernement américain n'est pas vraiment une surprise pour bon nombre d'observateurs.

Eliminer les données superflues

Pour en revenir à HAVEn, le « n » de l'acronyme représente le nombre potentiel de systèmes qui pourraient être construits à partir de n'importe quelle combinaison de ces logiciels. Par exemple, les données de HP Operations Analytics, qui surveille l'état opérationnel des systèmes informatiques, pourraient être jumelées au moteur d'analyse de Vertica, afin d'identifier plus rapidement les points chauds dans le SI.

Hewlett-Packard veut également aider les entreprises à se débarrasser de leurs données inutiles - toutes les informations devenues obsolètes - afin de libérer de l'espace coûteux sur les serveurs de stockage. La solution Autonomy Legacy Data Cleanup peut ainsi automatiquement supprimer les fichiers inutiles dans des serveurs SharePoint et les boites mails. Ce module analyse les données en fonction de plusieurs facteurs, dont l'âge du document, afin de déterminer ce qui doit être conservé. Cette solution repose sur la version 4.0 de ControlPoint, le moteur de règles d'Autonomy. Ainsi si une organisation a une politique de gouvernance de l'information avec une conservation des données pendant sept ans, le logiciel va supprimer toutes les données de plus de sept ans. Il va déraciner et supprimer tous les doublons dans les bases. Il peut aussi considérer combien de fois certaines données sont consultées par les salariés : les données les moins consultées étant les plus appropriées pour la suppression. Les administrateurs peuvent définir d'autres contrôles. Si elle est utilisée en conjonction avec l'indexation et les capacités de catégorisation de la plate-forme d'analyse des données d'Autonomy IDOL, ControlPoint 4.0 permet d'éliminer les grappes de données relatives à un sujet précis.

Une version complète de Vertica en test

Toujours dans le domaine du big data, HP a décidé de proposer une version gratuite et complètement fonctionnelle de sa base de données Vertica Analytics, rebaptisée pour l'occasion Vertica Community Edition. Les utilisateurs pourront télécharger et déployer le logiciel pour analyser jusqu'à 1 téraoctet de données, sans frais et sans limites de temps. La société avait déjà mis en ligne une version d'évaluation de Vertica, mais cette dernière ne possédait qu'un sous-ensemble de toutes les fonctionnalités du logiciel. L'utilisation d'une mouture complètement fonctionnelle - même limitée à 1 To de données - pourrait aider les organisations à tester différentes manières d'analyser leurs données avant de se lancer dans la création d'un nouveau système d'analyse de données.

HP a bien sûr terminé sa conférence de presse big data avec un focus sur les services. La division Technology Services a étendu ses solutions de conseil pour aider les entreprises à bâtir des systèmes big data. Plus d'expertise est en effet nécessaire pour accompagner les entreprises à redéfinir leur stratégie et leur architecture informatiques - de l'infrastructure du système à la protection des données notamment - lorsqu'il s'agit de la mise en oeuvre de clusters Hadoop.