Les nouveaux partenaires envisagent de mettre en route un pipeline destiné aux clients de Teradata qui utilisent la distribution Hadoop de Cloudera (CDH). Ceux-ci précisent que le pipeline sera utilisé pour acheminer des données non structurées provenant de diverses sources en ligne directement vers une installation Teradata où les masses de données brutes pourront être analysées en détail. L'objectif est de permettre aux utilisateurs de rassembler et de consulter de grands pools de données, et de profiter d'une quantité d'informations utiles émanant de sources de données structurées et non structurées comme jamais ils n'ont pu le faire auparavant.

Hadoop, le framework de traitement qui travaille en parallèle pour exécuter des programmes écrits en Python, Java et autres langages, a été principalement utilisé jusqu'ici à des fins de data reporting, par exemple pour l'extraction de données des fichiers log sur les serveurs web. Mais celui-ci peut être mis utilement à contribution dans des domaines qui couvrent la reconnaissance et l'analyse d'images jusqu'à la collecte et le déplacement de données à grande échelle.

Améliorer le traitement d'énormes quantité de données

Comme l'a déclaré Mike Olson de Cloudera, grâce à cette solution additionnelle, les clients de son entreprise peuvent maintenant relier leurs résultats de recherche à des indicateurs financiers, des profils clients, et autres. Mais selon Richard Winter, président de Winter Corporation, une entreprise spécialisée dans les solutions impliquant des gros volumes de données, ce puissant outil intégré, dédié à l'analyse complexe des données, pourra aider de nombreux utilisateurs à renforcer leurs atouts sur le plan concurrentiel.

Ce développement révolutionnaire est possible grâce à la compatibilité des réseaux de traitement parallèles (comme Hadoop) avec l'entreposage de données en parallèle (géré par le moteur analytique de la base de données de Teradata). Chaque système peut avoir été mis en place pour différents types d'analyse, mais lorsqu'ils sont combinés - comme le font Teradata et Cloudera - ils peuvent aider les utilisateurs à réunir des quantités énormes de données en provenance de toutes sortes de sources. Mais ce n'est pas tout. Selon un expert, le déploiement des deux technologies en parallèle peut aider à explorer de nouvelles opportunités, à inventer de nouvelles applications et à disposer de meilleurs avantages concurrentiels.

Les deux partenaires ont prévu de travailler très étroitement pour mettre sur pied ensemble cette solution de pointe. Le Hadoop Connector de Teradata sera livré gratuitement avec Cloudera Enterprise, à charge pour Cloudera d'apporter le support technique du Connector. La commercialisation de la solution sera menée de manière conjointe, à l'occasion de forums, d'évènements et de salons spécialisés.