Expert de l'analyse textuelle, l'éditeur français Proxem aide les entreprises à collecter et analyser d'importants volumes de données pour en extraire des informations pertinentes pour leur activité. Créée en 2007 par son actuel CEO François-Régis Chaumartin, Proxem se définit aujourd'hui comme un spécialiste de l'analyse sémantique des big data. Les solutions qu'il propose en SaaS servent à identifier des problématiques à prendre en compte, ou encore à restituer les sentiments exprimés à propos d'une marque et de ses produits, sur le web ou les médias sociaux. Ici, l'analyse sémantique lève les ambiguïtés dans le cas de marques qui sont aussi des noms communs, comme « carrefour » ou « orange ».

Sortis à l'issue de trois années de R&D, les premiers produits de Proxem ont bénéficié du partenariat du monde académique. Le moteur Antelope s'associe à un outil de veille, une gestion de documents ou un logiciel de CRM pour les compléter d'une couche sémantique. Il permet d'annoter et de catégoriser les informations, d'en extraire une terminologie, de faire de l'analyse de sentiments et d'établir des graphes thématiques. En 2014, l'éditeur va renforcer son effectif. De 11 personnes fin 2013, Proxem prévoit de passer à 20 collaborateurs fin 2014. « Nous sommes sur une année d'accélération », nous a confirmé François-Régis Chaumartin lors d'un entretien téléphonique. « Nous recherchons des data scientists, des ingénieurs informatiques avec une double compétence, aimant les maths, l'informatique et la langue. » Lui-même a soutenu sur le tard une thèse de linguistique théorique il y a un an à Paris VII. 

La façon dont on alimente le modèle est primordiale

Sur cette ligne, le CEO explique que pour rejoindre l'équipe spécialisée dans l'analyse sémantique, il faut conjuguer plusieurs passions. « N'être pas seulement intéressés par les modèles mathématiques mais aussi par les données à manipuler car les modèles sont alimentés à partir des caractéristiques du texte. » La composante linguistique est primordiale. « La façon dont on alimente un modèle est aussi importante que le modèle lui-même », insiste le fondateur de Proxem. Le recrutement porte aussi sur des profils plus diversifiés (Sciences Po ou la Sorbonne, par exemple).

Dans l'offre de l'éditeur, la solution Ubiq Voix du Client, permet à une entreprise de traiter les réactions émanant de ses clients, recueillies de façon automatisée à partir de diverses sources : mails, études marketing, sondages, appels téléphoniques... L'analyse sémantique de ces données va faire remonter les problèmes de qualité, de tarification, les risques juridiques ou sanitaires. « A partir de l'analyse de plusieurs milliers d'avis, on peut aussi détecter des signaux faibles pour améliorer les ventes », explique François-Régis Chaumartin, Proxem ayant identifié en particulier des business cases dans la grande distribution. Le dirigeant cite en exemple une chaîne d'hypermarchés s'étant aperçu qu'il fallait laisser plus longtemps en rayon certains articles saisonniers. Parmi ses clients dans ce domaine figure des acteurs comme Auchan et Carrefour. 

En 2014, des enquêtes en temps réel sur la base du web

« Dans l'univers de la grande distribution, entre les sources internes et ce que les clients envoient, il y 5 millions de documents par an. C'est une « petite big data ». Nous ne prétendons pas remplacer l'humain, mais sur ces volumes de données, nous pouvons diviser par 5 ou 10 le temps que des utilisateurs passent sur le système », souligne le CEO. Chez Auchan et Carrefour, par exemple, le marketing dispose d'une équipe dédiée à l'étude de la voix des clients.

Les outils de textmining de Proxem analysent les documents pour trouver les points importants, effectuent de la mise en corrélation et dégagent un tableau d'ensemble. L'objectif, c'est de pouvoir gagner du temps au quotidien et créer de la valeur, pointe le dirigeant de Proxem. Il souligne par ailleurs, de façon générale, l'efficacité des technologies d'analyse sémantique développées par les éditeurs français par rapport aux solutions conçues au départ pour traiter l'anglais, ces dernières se révélant souvent « plus modestes » sur les langues européennes. Proxem a aussi développé une solution de veille, Ubiq E-Réputation, pour analyser les conversations sur le web et les réseaux sociaux. Carrefour l'utilise pour suivre en temps réel sa marque et ses concurrents.