Après avoir acquis 11% du capital d'Aster Data l'an dernier, le spécialiste du datawarehousing Teradata a décidé d'acheter entièrement cette start-up de la Silicon Valley qui propose des appliances d'entrepôts de données. La société, co-fondée en 2005 par Mayank Bawa et Tasso Argyros, a développé des fonctions analytiques adaptées pour de très importants volumes de données, couramment appelés « Big Data ». Teradata déboursera 263 millions de dollars pour acquérir la totalité de l'entreprise. La transaction devrait être finalisée au deuxième trimestre.

Le terme « Big data » ne désigne pas uniquement le flux d'information qui s'accroît constamment, mais aussi la juxtaposition de données structurées et non structurées, ce qui induit des interrelations complexes qui ne peuvent pas s'analyser avec les techniques traditionnelles. En rachetant Aster Data,  Teradata, qui est lui-même l'un des principaux acteurs du datawarehouse, s'attaque donc au défi posé par ces nouveaux traitements. Cette acquisition est la deuxième en trois mois pour l'éditeur californien, ancienne filiale de NCR. En décembre, pour étendre son périmètre fonctionnel, il avait déboursé 525 M$ pour mettre la main sur l'éditeur de logiciels de marketing Aprimo.

Juxtaposer données structurées et non structurées

James Kobielus, analyste pour Forrester Research, voit d'un bon oeil l'absorption d'Aster Data, une société qui a remporté des clients et qui, d'une façon générale, tourne bien. Il rappelle que l'architecture technique qu'elle a développée peut prendre en charge en même temps, sur différents noeuds, des données venant d'environnements analytiques et d'environnements transactionnels. Cela apporte à Teradata une technologie clé à exploiter dans la bataille qui s'engage, notamment face à Oracle et sa plateforme Exadata, estime James Kobielius. Oracle a en effet insisté sur la capacité de son offre à prendre en compte indifféremment ces deux types de traitement.

SAP et IBM ne sont pas en reste sur ce terrain. Le premier a sorti fin 2010 l'appliance HANA pour exploiter d'importants volumes transactionnels en temps réel, et ce mois-ci il a lancé sa suite BI 4.0 qui peut s'utiliser en frontal de HANA et analyse à la fois les données structurées et non structurées. IBM travaille aussi sur la manipulation des Big Data et développe des offres analytiques basées sur Apache Hadoop et le framework MapReduce.

Réduire les temps d'apprentissage de MapReduce

Dans ce domaine, Teradata va bénéficier du travail réalisé par Aster Data pour supporter le framework MapReduce et traiter les gros volumes de données, souligne James Kobielus, de Forrester. Développer avec ce framework requiert des compétences spécialisées et Aster a conçu des outils qui réduisent de façon significative le temps d'apprentissage en rapprochant MapReduce du standard SQL, peut-on lire sur le site web de la start-up. Ces outils aideront Teradata à diffuser plus largement les capacités de MapReduce, a déclaré Darryl McDonald, vice-président exécutif des applications et directeur marketing, lors d'une conférence téléphonique.

La plateforme d'Aster Data peut aussi être déployée dans le cloud, sur Amazon Web Services, AppNexus, Data Cloud de Dell et Terremark. Jusqu'à présent, l'éditeur vendait son offre sous la forme de licences perpétuelles. Teradata envisage aussi de proposer une offre par abonnement, a indiqué l'un de ses porte-parole. Petit à petit, les spécialistes indépendants des technologies de datawarehouse et de fonctions analytiques avancées ont donc été rachetés par de grands acteurs. La dernière absorption en date remonte à deux semaines lorsque HP a mis la main sur Vertica. Mais les mois précédents, IBM avait acquis Netezza et EMC, Greenplum. Parmi les sociétés pouvant encore être rachetées, on trouve des éditeurs comme ParAccel, indique James Kobielus. Il reste aussi Infobright et Kognitio.

Illustration : L'appliance de datawarehouse MapReduce d'Aster Data permet d'exploiter des technologies massivement parallèles sur du matériel Dell peu coûteux.