A force de marteler que l'usage des données s'est aujourd'hui généralisé dans l'ensemble de la société, il ne fallait pas s'étonner que la sphère politique s'en empare. Pour preuve, les candidats à la présidentielle se sont massivement appuyés sur des outils analytiques pour cartographier les attentes des citoyens et gérer leurs bases de partisans. L'exemple le plus parlant est celui du mouvement d’Emmanuel Macron En Marche. En amont de l'élection, ses partisans ont fait circuler auprès de 100 000 français des questionnaires de 8 questions dans le but de récolter leurs impressions sur la situation du pays.

En s'appuyant ensuite sur l'expertise de la start-up spécialisée dans la stratégie électorale Liegey Muller Pons et sur les solutions d'analyse sémantique de Proxem, le mouvement a pu obtenir une cartographie complète des attentes des citoyens. « Nous avons récupéré plus de 1,5 million de mots dans un tableur Excel qu'il a fallu analyser et classer en fonction des ressentis », explique François-Régis Chaumartin, le fondateur de Proxem. Il se targue d'avoir pu s'appuyer sur des technologies de deep learning pour éviter les longues phases de contextualisation, nécessaires à l'analyse sémantique des données. Un des résultats les plus flagrants est sur le nucléaire. « Nous avons montré que quand l'usage du nucléaire était associé à l'économie, sa perception était bonne mais quand il l'était à l'écologie, c'était l'inverse », explique le dirigeant.

Cartographier les attentes citoyennes partout, tout le temps

Les solutions de Proxem sont également utilisées par Harris Interactive pour réaliser son étude hebdomadaire des réseaux sociaux. « En s'appuyant sur l'analyse sémantique, l'institut d'étude marketing peut prendre la température des réseaux sociaux. Ils ont par exemple été les premiers à mettre en exergue l'investissement massif de la droite alternative américaine aux côtés de Marine Le Pen, tant son nom était associés à des verbatim en anglais », raconte François-Régis Chaumartin.

Liegey Mullier Pons (LMP) va encore plus loin dans l'analyse à des fins politique. « Nous partons aujourd'hui du principe qu'une campagne réussie se base autant sur les hautes technologies, les données et l'humain », déclare Guillaume Liegey, un des co-fondateurs de la start-up. Ainsi, sa solutions 50+1 utilise un algorithme qui permet, en s'appuyant sur toutes les données disponibles (recensement, liste électorale, etc) de cartographier dans chaque quartier (60 000 zones identifiées en France) quel est le nombre de voix peut y récupérer un candidat. A lui ensuite d'organiser des campagnes de porte-à-porte pour aller convaincre ces gens en fonction des résultats. D'où l’intérêt de bien connaître ses partisans et de pouvoir facilement les coordonner.

Gérer des partisans n'est pas une mince affaire

C'est pour adresser ce marché que la start-up Digitalebox s'est créée en 2013 à l'initiative de Vincent Moncenis. Elle permet aux élus de gérer leurs bases de militants. « Comme dans le cadre d'une démarche marketing classique, l'enjeu est de délivrer le bon message au bon moment à la bonne personne et par le bon canal », explique Vincent Moncenis. A ces fins, la solution s'appuie sur des bases de données NoSQL pour regrouper les militants suivant différents critères. De l'autre côté de la chaîne la solution permet de gérer des campagnes à travers les canaux traditionnels (email) et les réseaux sociaux. Aujourd'hui, Digitalebox est utilisée par plus de 200 élus et plusieurs candidats à la présidentielle.

Reste que la question de l'analyse des données reste aujourd'hui problématique, d'autant que dans le cadre de la présidentielle, elles témoignent souvent de l'orientation politique de leur propriétaire, un critère sensible aux yeux de la CNIL. « Nous avons tous vu ce qui est arrivé aux américains de NationBuilder qui se sont fait taper sur les doigt après avoir automatiser la collecte des données sur les réseaux sociaux. Pour notre part nous ne travaillons qu'avec des données anonymisées », explique François-Régis Chaumartin. Chez LMP, le parti pris est le même. « Nous travaillons depuis longtemps en bonne intelligence avec la CNIL. Nous nous sommes posés la question d'utiliser ou non les données issues des réseaux sociaux et avons défini que tant qu'elles resteront anonymes, la chose ne serait pas problématique », explique Guillaume Liegey.

Une porte ouverte au populisme ?

Au delà des considérations de protection de la vie privée, l'analyse poussée des données à des fins politiques pose aussi des questions éthiques. Avec une cartographie des attentes citoyennes comme celle qu'a permis de réaliser la solution Proxem, il est facile pour les candidats de tomber dans le populisme. « C'est ce que nous avons vu avec Trump, il a utilisé des solutions similaires pour parfaitement identifier les frustrations de la classe moyenne blanche américaine et s'en est parfaitement servi. Au final, tout dépend des intentions du candidat », conclut François-Régis Chaumartin.