Teradata a présenté fin juin à Paris les apports de la mouture 14.10 de sa base de données, moteur d'analyse haute performance sur lequel s'appuient ses solutions d'entrepôts de données. Le fournisseur américain décline celles-ci en une famille d'appliances intégrées et de logiciels, allant du datawarehouse d'entreprise jusqu'à l'offre cloud Express. « La 14.10 est en théorie une mise à jour mineure après la 14, version majeure livrée l'an dernier, mais elle apporte en fait de nombreuses fonctionnalités intéressantes », a expliqué Martin Willcox, directeur marketing plateforme et solutions chez Teradata pour l'international (*), en marge de l'étape parisienne du CTO Roadshow 2013, le 27 juin dernier.

De fait, cette version 14.10, prévue pour la fin de ce mois, tire parti de la technologie Intelligent Memory annoncée en mai par le fournisseur. Celle-ci exploite le in-memory de façon sélective. Elle permet aux utilisateurs de configurer la mémoire pour y créer, au-delà du cache, un espace où conserver les données les plus utilisées, notamment pour des applications de big data. Cette technologie s'insère dans l'architecture Unified Data du fournisseur qui permet aux clients de Teradata d'utiliser conjointement différentes plateformes : datawarehouses intégrés, appliance d'analyse Aster Discovery (exploitant MapReduce pour les données semi-structurées), ainsi qu'Apache Hadoop (une famille de solutions basées sur Hortonworks vient d'être annoncée). Dans ce dernier cas, les données les plus consultées dans Hadoop via l'interface Teradata SQL-H sont transférées vers Intelligent Memory pour optimiser le traitement des requêtes. « Il s'agit d'une façon plus intelligente de gérer la mise en cache des données, et de façon complètement automatisée, en ligne avec la philosophie de Teradata », résume Martin Willcox, en insistant sur la volonté de limiter les interventions d'administration sur la base de données.

Indexation géospatiale plus facile à déployer

La baisse du prix de la mémoire vive a conduit des fournisseurs comme SAP à bâtir des solutions telles qu'HANA pour gérer l'ensemble des données in-memory. Mais le coût de cette ressource reste élevé, souligne le directeur marketing de Teradata, et la puissance CPU doit être dimensionnée en conséquence. En se penchant sur la façon dont ses clients exploitaient leurs données, le fournisseur américain a constaté un schéma 80/20, montrant que 80% des utilisateurs n'accédaient qu'à 20% des données. D'où l'approche dynamique d'Intelligent Memory qui dope les performances en limitant le coût global.

Le CTO Roadshow 2013 est aussi revenu sur les améliorations de l'indexation géospatiale apportées par la version 14.10, a par ailleurs expliqué Martin Willcox, en évoquant à ce sujet les prévisions tablant sur 50 milliards de dispositifs connectés à Internet d'ici 2020, équipés de capteurs transmettant leur position. La base Teradata importe et exporte des données géolocalisées qu'elle stocke et rapproche des autres données de l'entreprise au sein du datawarehouse, notamment pour des analyses statistiques de séries temporelles. « Nous supportons l'indexation géospatiale depuis plusieurs versions, mais nous avons introduit dans la version 14.10 un nouveau type d'indexation, plus performant et également plus facile à déployer parce que nous voulons que le système reste aussi auto-administrable que possible », a indiqué le directeur marketing. 

IPE : Optimisation des requêtes complexes

Le 3e sujet abordé à Paris sur la 14.10 a porté sur un concept appelé Incremental planning and execution (IPE), a indiqué Martin Willcox. Teradata a toujours optimisé le traitement des requêtes en se basant sur la façon dont les ressources de traitement étaient consommées. « Lorsque le système reçoit une requête, d'un utilisateur, d'une application ou d'un outil, plutôt que d'utiliser des règles décidant comment l'exécuter, il calcule le coût de toutes les façons possibles de l'exécuter et choisit celle qui est la moins gourmande en termes de ressources CPU, I/O, etc. Nous continuons à faire avancer cette technologie », a expliqué le directeur marketing. Au sein de requêtes contenant des expressions complexes, certaines valeurs seront évaluées en premier ce qui pourra conduire à réécrire la requête et à déterminer ensuite la façon la plus appropriée de l'exécuter (faut-il mieux utiliser tel index ou telle partition d'index...).

« C'est une fonctionnalité que, je pense, vous ne retrouverez que dans Teradata et cela ne représente encore que le début d'IPE pour nous », assure Martin Willcox. « Dans la version initiale, nous nous sommes concentrés sur une classe de requêtes particulières, mais nous allons nous appuyer sur l'infrastructure installée dans Teradata 14.10 pour étendre cette idée à des types de requêtes de plus en plus complexes pour les versions futures. Et, toujours, de façon complètement automatisée », a souligné Martin Willcox. Selon lui, les autres systèmes d'optimisation de base de données ne peuvent pas gérer ce niveau de complexité de cette façon et font intervenir des DBA. Une approche qui ne peut pas suivre face à des milliers ou des dizaines de milliers d'utilisateurs qui soumettent des requêtes, ajoute-t-il.

De gros investissements sur les tests

La mise à jour 14.10 devrait donc arriver fin juillet. « Nous procédons aux tests finaux qui font suite au programme bêta avec des clients ». Ces dernières années, les nouvelles versions semblent avoir été adoptées un peu plus vite qu'auparavant, remarque Martin Willcox. Il l'explique par l'importance des améliorations apportées par Teradata, comme les fonctions de stockage virtuel, pour gérer de façon automatisée les environnements hybrides (disques durs et SSD), l'analyse en colonnes ou la fonction Temporal qui gère les dates et l'historique lors du chargement des données. « Nous avons aussi énormément travaillé sur l'amélioration des opérations de tests, et avons beaucoup investi sur des procédures automatisées. Je pense que nos clients le reconnaissent ».

(*) Hormis le marché américain (incluant l'Amérique latine), Teradata International couvre les autres zones géographiques, soit l'Europe, le Moyen-Orient, l'Afrique et l'Asie.