Hasard du calendrier, l'étape parisienne du CTO Roadshow de Teradata, fin juin, a coïncidé avec l'annonce, par le fournisseur américain, de son portefeuille d'offres pour Hadoop. Celui-ci est constitué de quatre solutions : deux appliances Teradata (dont l'une, hybride, exploite Aster Database), une offre réalisée avec Dell, fournie par le constructeur texan (Commodity Offering for Hadoop) et une version uniquement logicielle. Sur la mise en oeuvre d'Hadoop, Teradata avait initialement noué un partenariat avec Cloudera, qu'il poursuit. Mais cette fois, le portefeuille annoncé repose sur Hortonworks Data Platform (HDP). « Nous travaillons beaucoup avec Hortonworks en ce moment qui, comme nous, a un important département R&D (*). Par ailleurs, ils sont engagés à 100% dans une distribution Open Source de Hadoop et travaillent avec leurs partenaires de la même façon que nous pour créer de la valeur ajoutée sur l'intégration. Notre SQL-H Interface, qui utilise une extension à la syntaxe SQL et que nous développons avec eux, en est un bon exemple », a commenté lors d'un entretien à Paris Martin Willcox, directeur marketing plateforme et solutions chez Teradata pour l'international.

D'autres fournisseurs de base de données approchent Hadoop différemment, rappelle-t-il. « Mais il y a un point d'intégration primaire qui exploite le standard de métadonnées HCatalog et qui est supporté par Hortonworks. L'intégration est ainsi plus facile à mettre en place et fournit de meilleures performances, on peut par exemple faire du partitionnement avancé. Et nous pouvons le faire avec Hortonworks parce qu'ils ont la même vision d'Hadoop que nous. D'autres travaillent avec les metadonnées mais ils créent des logiciels propriétaires qu'ils ne reversent pas dans l'Open Source », pointe Martin Willcox.

Un réel risque de fragmenter Hadoop

Teradata veut faire sortir Hadoop de la Silicon Valley pour le faire adopter plus largement, affirme le directeur marketing. « Nous pensons qu'il y a beaucoup d'organisations qui sont intéressées par Hadoop mais qui sont bloquées parce qu'elles ne disposent pas des bonnes compétences pour l'installer et qu'elles ne savent pas comment la technologie va s'insérer dans leur architecture. Nous avons deux objectifs : apporter cette expertise aux clients pour qu'ils puissent déployer de façon appropriée, et aussi créer des logiciels à valeur ajoutée autour de cet environnement ». En cela, Martin Willcox marque la différence de Teradata avec d'autres fournisseurs qui créent leurs distributions d'Hadoop. Il cite en exemple IBM ou EMC Pivotal. « Ce n'est pas notre approche, nous pensons qu'il y a un réel risque qu'Hadoop devienne un peu comme Unix dans les années 80/90, fragmenté... Que l'on trouve de nombreuses versions suffisamment différentes pour créer des problèmes d'intégration, mais pas assez différentes pour apporter une valeur particulière les unes par rapport aux autres. Nous voulons donc qu'Hadoop reste Open Source et créer du logiciel qui l'étende plutôt que le rendre propriétaire », pointe le directeur marketing. « Hortonworks partage notre vision ».

Ce qui n'empêchera pas Teradata de faire d'autres annonces avec Cloudera, probablement dans le courant de cette année. Sa stratégie ayant toujours reposé sur le « best of breed ». Les clients qui ont installé ses solutions ou celles d'Aster (racheté en 2011) ont investi dans d'autres logiciels aussi. « Nous ne leur demandons pas de tout jeter pour travailler avec nous et avons toujours eu des partenariats avec les principaux éditeurs d'outils de BI, d'ETL, de logiciels de CEP (traitement d'événements complexes) et de bus d'entreprises. « Et, bien sûr, nous voulons collaborer avec les principaux distributeurs d'Hadoop ».

Une appliance de production et des solutions de test

Au sein du portefeuille de produits s'appuyant sur la distribution de Hortonworks, l'Appliance for Hadoop, équipée du logiciel SQL-H (HDP 1.1), est positionnée sur le marché existant de Teradata, précise Martin Willcox. Ce système prêt à l'emploi intègre matériel et logiciels de gestion, d'administration et de haute disponibilité (*). Il est logé dans une armoire de 204,5 x 61 x 124,4 cm (830 kg une fois installé), dispose de 152 To de stockage non compressé par armoire (le système peut être porté au total à 10 Po) et exploite, sous Linux Suse 11, deux doubles processeurs Core Xeon Intel, l'un de huit coeurs, l'autre six (pour le serveur de données). Une liaison InfiniBand à 40 Gb/s assure les échanges entre les systèmes Teradata, Aster et Hadoop. Côté logiciels, il intègre aussi HCatalog, plusieurs outils Open Source et des solutions partenaires, celles d'Informatica, de Revelytix, de Protegrity.