SAP poursuit l'intégration de sa base de données HANA in-memory avec sa solution Business Warehouse (BW). La dernière mise à jour ajoute le support des services de chargement de données en temps réel de HANA. En général, les entreprises qui ont de grands datawarehouses programment le chargement de leurs données en dehors des périodes de pointe, avec des traitements par lots pendant la nuit par exemple. Mais, avec l'arrivée de BW 7.4, disponible au niveau mondial, les services d'accès aux données de HANA peuvent, au moment où c'est nécessaire, aller puiser dans n'importe quelle source, à l'intérieur ou à l'extérieur de l'entreprise.

Dans cette approche, qualifiée de « data fabric in-memory » par SAP, les données ne sont pas déplacées physiquement dans Business Warehouse puisque le service voit les sources cibles comme des tables virtuelles. Celui-ci offre non seulement un accès plus large aux jeux de données, mais il permet aussi de conserver les plus sollicitées dans l'entrepôt de données principal, accédant au coup par coup à celles qui ne sont appelées qu'occasionnellement. SAP pousse sa base de données IQ (acquise lors du rachat de Sybase) comme une solution idéale pour piocher dans ce type de données « froides ». « L'accès aux données en temps réel permet également aux utilisateurs de Business Warehouse de générer de meilleurs rapports BI », souligne Neil McGovern, directeur senior, Marketing produit et innovation, chez SAP. En effet, « On accède toujours aux dernières données parce que l'on est connecté directement à la source ». Pour Ken Tsai, vice-président et responsable marketing de l'offre HANA, les entrepôts de données centralisés « ne sont plus viables ».

Limite à 60 caractères supprimée sur les champs texte

Pourtant, SAP cherche toujours à prouver les capacités d'évolutivité de HANA et BW. Sur ce terrain, l'éditeur allemand a récemment annoncé qu'il avait remporté le record Guinness du plus grand entrepôt de données pour son système de 12 pétaoctets tournant sur Amazon Web Services et chapeautant 111 instances HANA. Les requêtes sur le cluster se font en 330 millisecondes, contre 250 millisecondes pour une seule instance. Selon SAP, ces résultats prouvent qu'il est possible de gérer de très grands entrepôts avec un faible impact sur la performance globale.

Utilisateur de longue date de Business Warehouse, le fabricant de boissons Molson Coors est passé en production en novembre sur ces services en temps réel. La société utilise toujours la version 7.3 de Business Warehouse, mais elle a récemment participé à un projet pilote sous 7.4, a expliqué Pawel Mierski, responsable du développement senior en BI. La nouvelle version permet aux utilisateurs « d'accélérer jusqu'à deux fois les processus de modélisation et de conception, par rapport à la version 7.3 », a-t-il ajouté. Toutefois, le projet pilote auquel a participé le fabricant n'était pas axé sur le chargement des données en temps réel ni sur la montée en puissance massive de l'entrepôt. Il a surtout mis à profit la suppression de la limitation à 60 caractères des champs de texte apportée par la version 7.4. 

Des données chargées rapidement

Molson Coors travaille avec un autre fournisseur qui collecte, dans les médias sociaux, les avis sur l'entreprise. Celui-ci se charge aussi d'analyser et de trier les commentaires par catégories. Mais la limite des 60 caractères empêchait Molson Coors de récupérer directement dans Business Warehouse les messages des médias sociaux avec leurs URL pour générer des rapports visuels et mettre en évidence des indicateurs clés de performance. « L'entreprise n'avait d'autre choix que d'utiliser le fichier .CSV délivré par le fournisseur », a expliqué Pawel Mierski.

Pour l'instant, Molson Coors ne sait pas encore s'il va recourir aux services de chargement des données en temps réel apportés par la version 7.4. « L'option est encore à l'étude », a simplement déclaré le responsable du développement. « Mais l'intégration de HANA à Business Warehouse a déjà eu un impact très positif pour l'entreprise », a déclaré Pawel Mierski. « Un des avantages essentiels de HANA, c'est la vitesse à laquelle elle permet de charger les données en dehors des heures de pointe », a-t-il ajouté en expliquant que, jusqu'à présent, les équipes étaient frustrées parce qu'elles devaient attendre jusqu'à 10H ou 10H30 avant de disposer des données. « Toute la matinée, nous étions submergés de courriels et d'appels téléphoniques. Ce n'est plus le cas désormais ».