En outre, a indiqué Hasso Plattner, le stockage vertical affiche « des taux de compression 10 fois supérieurs à ceux du stockage traditionnel ». Sachant qu'une carte-mère actuelle peut accueillir jusqu'à 144 Go de RAM, « et que cela devrait monter à un demi-téraoctet dans 18 mois », cela ouvre des perspectives intéressantes pour monter toute une base de données en mémoire vive. En revanche, le stockage vertical donne des résultats bien moins bons lorsqu'il s'agit de mettre les données à jour, c'est pourquoi - malgré les rodomontades du fondateur de Vertica, Michael Stonebraker - il n'est pas utilisé pour les applications transactionnelles. Dès lors, les données de production doivent passer par le filtre de l'ETL pour alimenter un entrepôt de données qui servira de support à des applications analytiques ; autant dire, a expliqué Hasso Plattner, que l'information date un peu quand on la présente sous une forme lisible au dirigeant de l'entreprise.
Un accès dans la seconde à toute donnée dans 250 millions d'enregistrements
Avec son équipe universitaire, Hasso Plattner a décidé de passer outre les traditionnelles objections. « Nous avons étudié les solutions dont on disait qu'elles ne marcheraient jamais. » Au final, ils ont abouti à un prototype dont la démonstration sur scène était plutôt bluffante : une interface Excel 2007 couplée au système de recherches de données T-REX, de SAP, et à une variante - développée pour l'occasion - du langage de requête SQL, permettait d'accéder dans la seconde à des données de production (une base empruntée à un gros client, totalisant 250 millions d'enregistrements). Pour parvenir à ce résultat, Hasso Plattner est parti du principe que les bases transactionnelles avaient rarement besoin de mettre des données à jour : « dans 15% des cas pour les applications de prise de commande, dans 5 à 10% des cas pour les applications financières ». Du coup, la chose peut être réglée grâce à des insertions, ce qui permet de ne jamais verrouiller la base.
Parmi les autres avantages, le stockage vertical élimine la nécessité de réaliser des agrégats (sous-ensembles présélectionnés de la base), et élimine aussi la redondance des informations : reprenant des champs couramment dupliqués, Hasso Plattner a expliqué qu'il y a un nombre limité de pays, de devises... ou de sexes. Au final, la base s'en trouve réduite d'un facteur 20.
Arguant bien du fait qu'il n'est pas un dirigeant exécutif de SAP, Hasso Plattner s'est refusé à prendre tout engagement sur la transformation de ce prototype en produit. Il espère bien néanmoins pouvoir revenir sur scène dans un an avec un projet mené cette fois par la R&D de SAP.
En savoir plus :
En prélude au discours du Dr Hasso Plattner sur la conférence Sapphire (Orlando, 11-14 mai 2009), SAP a diffusé quelques « saviez-vous » interpelant l'auditoire sur les problèmes de performances :
Saviez-vous ? Aujourd'hui, une CPU peut avoir 3 milliards de cycles en une seconde. En une seconde, la lumière voyage jusqu'à la lune
mais durant le temps d'un cycle de CPU, la lumière ne parcourt que 10 cm.
Saviez-vous ? Une carte-mère avec 8 CPU de 16 coeurs sera bientôt disponible. C'est 128 fois la puissance de calcul d'un unique processeur. Ou plus de 400 milliards de cycles CPU par seconde sur un seul serveur lame. Mais la majorité de cette puissance de calcul sera perdue... dans l'attente de données.
Saviez-vous ? Une CPU accède à la mémoire cache de niveau 1 en 1 à 2 cycles. Elle accède à la mémoire cache de niveau 2 en 6 à 20 cycles. Elle accède à la RAM en 100 à 400 cycles. Elle accède à la mémoire flash en 5 000 cycles. Mais elle accède aux données sur disque dur en 1 million de cycles !
Si les cycles étaient des miles et cet écran était une CPU, alors le cache de niveau 1 serait ce centre de conférences, le cache de niveau 2 serait à la périphérie de la ville, la RAM serait dans un autre Etat, la mémoire flash dans un autre pays, et le stockage sur disque dur sur la planète Mars.
Saviez-vous ? Pour une simple recherche de données, la CPU peut aller 4 à 8 fois en RAM, 2 à 4 fois sur le disque. Ce serait comme aller jusqu'au Texas pour boire un verre d'eau et jusque sur le planète Mars pour remplir votre verre.
A lire aussi :
- le 14 mai : Sapphire 2009 : SAP affirme sa position dans le décisionnel avec Explorer