De nombreux outils d'analyse et d'apprentissage machine se connectent aux données stockées dans des data warehouses ou des data lakes, exécutent des algorithmes sur des ensembles de données complets ou un sous-ensemble de données et calculent les résultats sur des architectures cloud. Cette approche fonctionne bien lorsque les données ne changent pas fréquemment. Mais que se passe-t-il si les données changent fréquemment ? Aujourd'hui, de plus en plus d'entreprises doivent traiter des données et calculer des analyses en temps réel. L'IoT est à l'origine d'une grande partie de ce changement de paradigme, car le streaming de données à partir de capteurs nécessite un traitement et une analyse immédiats pour contrôler les systèmes en aval. L'analyse en temps réel est également importante dans de nombreux secteurs, notamment les soins de santé, les services financiers, la fabrication et la publicité, où de petits changements dans les données peuvent avoir des impacts -financiers, sanitaires, sécuritaires et autres - importants sur l'entreprise. 

Rival, pour certaines fonctionnalités, de GridGain ou FlashGrid, la start-up Hazelcast se focalise désormais sur l’exploitation en temps réel des flux de données avec sa Platform 5.1. Les cas d'utilisation les plus courants sont aujourd'hui le filtrage et l'agrégation des données. Avec le déploiement de capteurs IoT à grande échelle, les entreprises sont confrontées à la nécessité d'appliquer des algorithmes d'analyse, d'apprentissage automatique et d'intelligence artificielle en temps réel exigeant des ressources optimisées. En plus de stocker en mémoire les données afin qu'elles puissent être consultées, traitées et analysées plus rapidement, Hazelcast propose une plate-forme capable d'exploiter les données en continu au fur et à mesure de leur création, ce qui donne des informations plus significatives. L’idée est d'aller au-delà du traitement par lots. « Notre objectif est que la plate-forme Hazelcast devienne la couche de stockage et de traitement des données du dernier kilomètre pour les applications en temps réel, qu'elles soient transactionnelles, par lots ou en continu », assure David Brimley, vice-président en charge des produits chez Hazelcast. 

 

Pour assurer le traitement en continu des données au fur et à mesure de leur création, Hazelcast a ajouté davantage de fonctionnalités à sa plate-forme in-memory. (Crédit S.L.)

La version 5.1 de la plate-forme Hazelcast inclut l'agrégation de flux et le support de requêtes SQL supplémentaires, et une meilleure prise en charge de JOIN. Elle apporte également la prise en charge de SQL pour JSON afin que les entreprises puissent stocker et interroger à l'aide de ce format de données pour ajouter des capacités de traitement en temps réel. Avec l'intégration de ces dernières, la plate-forme Hazelcast propose d’enrichir les données collectées avec des informations liées à leur contexte. Cette 5.1 ajoute la possibilité de créer des vues et des index, et d'exécuter des plans de reprise dans SQL. Hazelcast assure également que sa dernière plate-forme apporte une plus grande disponibilité en nécessitant moins de temps d'arrêt pour la maintenance. Affichant son ambition, le CEO de Hazelcast, Kelly Herrell, compte bien remplacer certains grands systèmes : « Les mainframes fonctionnent bien, mais ils appartiennent au passé. Et chez les clients qui ne désirent pas changer les systèmes existants, le recours à Hazelcast peut améliorer l'ensemble ». Ainsi, chez BNP Paribas, il a fallu six mois pour déployer la plateforme Hazelcast et accélérer la solution de détection de fraudes aux cartes bancaires.

L'ajout d'un stockage hiérarchisé - en version bêta pour l’instant - à la plate-forme Hazelcast élimine la nécessité d’exploiter une base de données tierce. Le stockage hiérarchisé permet également aux clients d'enrichir facilement les données en temps réel avec de plus grands ensembles de référence historiques stockés sur des disques durs ou des SSD pour créer le contexte requis. La mise en production est attendue avec la version v5.2 de la plate-forme. La plate-forme Hazelcast 5.1 est disponible sur le cloud du fournisseur, en tant que logiciel à déployer sur site (une VM en fait) ou dans les environnements cloud d'AWS, de GCP ou de Microsoft Azure. Hazelcast commercialise sa solution en mode direct avec un peu d'indirect via son partenaire IBM. « Nous travaillons depuis deux ans avec IBM, car leur solution de data streaming n'est pas très cloud friendly », conclut le CEO. D'autres partenariats sont attendus dans les prochaines mois, chez HPE par exemple.