Vishal Sikka, directeur technique de SAP, et assurément l'un des hommes forts de l'éditeur allemand d'ERP, a confirmé que la société préparait avec HP et IBM des « appliances » pour analyser en temps réel et en mémoire les données transactionnelles gérées dans ses différentes versions d'ERP. Ces équipements ne seront pas mis sur le marché avant la fin de l'année mais SAP va déjà proposer à certains de ses clients de les tester. L'annonce a été faite hier, à Francfort, dans le cadre de la conférence utilisateurs SapphireNow 2010, en duplex avec Orlando où se tenait le versant américain de l'événement.

L'émergence de ces technologies d'analyse en mémoire, capables d'opérer sur des volumes de données de l'ordre du téraoctet, en s'affranchissant donc des accès aux disques durs, résulte de la conjonction des avancées spectaculaires réalisées au cours des dernières années sur le matériel (processeurs, mémoires...). Le CTO (chief technology officer) de SAP énumère les processeurs multicoeurs qui permettent de disposer de 64 coeurs sur une seule lame (blade), en tournant à des fréquences de 2 à 3 GHz, et l'amélioration des performances sur les mémoires (capacité et rapidité -100 Go par seconde) conjuguée à la baisse radicale de leur coût. « Il est aujourd'hui possible de gérer jusqu'à 2 To sur une seule lame », souligne-t-il. A cela s'ajoute le stockage des données en colonnes qui, associée à des fonctions de compression des index, permet de réduire dans des proportions très importantes la taille nécessaire pour traiter en mémoire des milliards d'enregistrements. Vishal Sikka cite l'exemple d'un client gérant 4,7 milliards d'enregistrements, sur 74 000 tables. Le stockage en colonnes a permis de ramener ces données sur 250 Go de mémoire, ce qui correspond à des capacités couramment disponibles sur des serveurs lames actuellement.

« Pour tirer pleinement parti de ces avancées, nous avons réuni trois équipes de développement de SAP », a poursuivi le CTO. Outre celle qui travaille sur MaxDB (la base de données maison qui existe depuis maintenant 33 ans et tourne chez plusieurs milliers de clients de l'éditeur), il cite l'équipe qui a développé TRex, et élaboré il y a dix ans la première technologie de stockage en colonnes en mémoire de l'éditeur. « Le résultat combiné de leurs efforts a débouché sur une technologie capable de traiter en mémoire 2 Mo de données en une milliseconde par coeur en tirant avantage des processeurs multicoeurs. Vous imaginez la vitesse à laquelle le système peut parvenir en multipliant 2 Mo par 64 coeurs, sur des données stockées en colonnes et compressées, jusqu'à 10 à 50 fois ».

Des requêtes en temps réel sur des données transactionnelles

Le disque est ici utilisé comme un système de stockage secondaire, persistant, et le calcul sur les données se fait sans procéder à des agrégats. « Rien n'est matérialisé, ni stocké sur des couches intermédiaires, ce qui vous permet d'obtenir des réponses en temps réel sur les données. Vous pouvez ainsi procéder à des requêtes sur les données transactionnelles, des requêtes directes sur les données financières, par exemple. »

Les appliances, préparées avec HP et IBM, seront rattachées aux datawarehouses, mais aussi aux systèmes transactionnels qui exploitent SAP R/3. « Les données transactionnelles seront copiées dans une nouvelle base de données en mémoire et analysées en temps réel. Vous pourrez procéder à toutes les requêtes possibles et imaginer de nouveaux types d'applications dans les domaines de la planification, de l'optimisation, du prévisionnel ou encore de la simulation ». Des capacités que SAP souhaite apporter à l'ensemble de ses clients, quelle que soit la version de son ERP qu'ils utilisent.