« Certaines PME peuvent aujourd'hui se payer des capacités d'analyse que, jadis, seuls des gouvernements pouvaient se payer » a relevé Laurent Ridoux, directeur technique big data chez HP. Il s'exprimait le 19 novembre 2014 lors d'une réunion à Paris consacrée au thème « Les possibilités illimitées de l'analyse prédictive » organisée par le Club de la Presse Informatique B2B (CPI-B2B). Les coûts techniques se sont en effet effondrés et permettent à la plupart des entreprises de disposer d'une puissance de calcul, d'une capacité de stockage, et des logiciels ou plates-formes de développement nécessaires à la réalisation d'un véritable analytique prédictif.

La baisse du coût de stockage, en particulier, évite d'avoir à se poser la question « je garde ou je jette » pour chaque type de données, permettant ainsi de tout garder. De ce fait, la plupart des entreprises peuvent se lancer dans le big data sans se ruiner. Mais Laurent Ridoux a rappelé, au sujet du big data : « la seule vraie nouveauté apportée par le big data en matière d'analytique, au delà de la croissance des volumes, c'est la capacité à inclure dans les algorithmes de traitement des données non-structurées. » Un exemple de données non-structuré, c'est les verbatim des clients dans un centre de contact.

Un système prédictif, c'est des données et des outils

Réaliser un analytique prédictif est avant tout une question certes de données mais aussi d'outils. « Il faut modéliser les comportements, ce qui peut prendre la forme d'une courbe à partir de calculs de corrélation jusqu'à une algorithmie beaucoup plus complexe » a observé Jean Charles Ravon, datascientist chez Teradata. Par exemple, une étude réalisée et publiée aux États-Unis a permis d'établir que, quand quelqu'un change d'opérateur téléphonique, la probabilité que les autres membres de sa famille fassent de même augmente considérablement.

Mais l'analyse prédictive n'a rien de révolutionnaire dans son principe. « Les actuaires font ainsi des analyses de risques et de détection de fraude depuis très longtemps » a pointé Arnaud de Scorbiac, directeur de l'activité Analytics chez Accenture. Mais l'analyse prédictive est en fort développement non seulement dans bien plus d'entreprises mais aussi dans de nouveaux domaines. Typiquement, la maintenance préventive des pièces mécaniques dans le transport s'appuie de plus en plus sur ce genre de traitements pour ne plus faire d'interventions à intervalles réguliers mais lorsque c'est réellement pertinent.

Le big data a facilité le développement des systèmes prédictifs

Le big data a cependant apporté sa pierre à la généralisation de l'analyse prédictive. En effet, l'analytique classique se contente d'étudier le passé pour comprendre ce qui a eu lieu. Et Marc Chemin, directeur du planning stratégique chez Capgemini, observe : « parce que le coût des solutions techniques, notamment de stockage, ont baissé, les volumes étudiés peuvent être bien plus importants et ainsi l'analyse peut être prédictive voire prescriptive. »

Il existe en effet une nuance entre l'analyse prédictive (« voilà ce qui va arriver ») et la prescriptive (« ce qu'il faut faire »). Cette dernière ne se contente pas d'indiquer l'évolution attendue mais aussi d'indiquer quelle solution adopter. Certaines applications peuvent être, par exemple, un moteur de recommandation sur un site d'e-commerce (comme Amazon) ou, une prescription quasi-médicale. Il existe ainsi des exemples d'analyse de statistiques de groupe recoupées avec des comportements individuels pour prescrire un type de comportement. Par exemple : les fumeurs mangeurs de hamburgers développent une pathologie cardiaque sauf s'ils font du sport, Untel fume et mange des hamburgers, Untel devrait donc faire du sport.

Une fiabilité variable

Va alors se poser la question de la fiabilité des analyses. Or les hypothèses du modèle de comportement ne sont pas nécessairement d'une totale fiabilité. Frédéric Brajon, directeur de l'activité big data et Data Science chez CGI Business Consulting, reconnaît ainsi : « la fiabilité est évidemment variable et dépend de la validité des hypothèses du modèle initial. » Si la probabilité d'un achat associé lors de l'achat d'un produit X peut être prédite relativement simplement, d'autres situations sont plus complexes. Par exemple, les modèles de prédiction autour des subprimes avaient prédit les éléments individuels (toutes les banques savent créer des modèles pour le crédit) mais pas l'effondrement du marché de l'immobilier. « Sur les systèmes mécaniques, la fiabilité est importante mais elle baisse dès qu'on tente de modéliser de l'humain » tranche Jean Charles Ravon.