Les annuaires du groupe SoLocal, notamment Les Pages Jaunes, réalisent les deux tiers de leur chiffre d'affaires avec les services en ligne. 20 millions de visiteurs uniques par mois réalisent en effet des milliards de requêtes géolocalisées. Le modèle économique du groupe repose sur la monétisation de ses services gratuits pour les utilisateurs finaux. Or, pour que les utilisateurs utilisent de façon répété le service, il est nécessaire que les résultats d'une recherche soient pertinents. Repérer les imperfections est donc fondamental, et cela sans beaucoup de plaintes directes.

Pour cela, le groupe So Local a mis en place une traçabilité des comportements des utilisateurs en ligne. Les données qui en sont issues sont traitées au sein de la Data Management Platform de l'agence Fifty-Five. Les analystes de données de cette agence ont d'abord défricher les voies d'analyse et de progression en démontrant la pertinence de leur intervention. Ils transmettent en ce moment les compétences utiles aux experts internes de SoLocal : ces compétences sont en effet jugées comme critiques et donc nécessairement internes. Cette analyse vient ainsi compléter les autres mesures et outils déjà en oeuvre mais qui ne permettaient pas de détecter certains types d'incidents. En particulier, les incidents de type « pas de réponse » sont bien connus.

Soigner son algorithme et sa base de données

« Une bonne recherche nécessite de bonnes données et un bon algorithme » rappelle Emmanuel Thoorens, Directeur Search et Données de SoLocal (ex-Groupe Pages Jaunes). Mais il y a une certaine zone grise dans la connaissance de la qualité des résultats. En effet, il est délicat a priori de savoir si un résultat remonté est satisfaisant ou pas par rapport à l'intention initiale de l'utilisateur dès lors qu'un résultat a bien été remonté.

Certains cas sont plus simples à repérer que d'autres. Les problèmes touchant les requêtes effectuées un grand nombre de fois vont être plus simples à repérer que les problèmes affectant des recherches exceptionnelles. Mais un important ensemble de requêtes rares peut être victime d'un problème commun grave qu'il faut alors repérer et traiter. Emmanuel Thoorens confirme : « le but est aussi de prioritiser les travaux des équipes techniques en focalisant leurs efforts sur les problèmes impactants. »

Affiner les requêtes

Par exemple, une recherche sur une Fédération Française peut donner toute la liste des Fédérations Françaises de tous les sports possibles, sauf celui voulu. Un tel problème peut être lié soit à l'absence de la bonne information dans la base de données (problème de donnée) soit à la mauvaise pondération des termes de la recherche avec un trop fort poids aux premiers termes et un trop faible au dernier (problème d'algorithme).

Pour détecter ce genre de problèmes, le comportement de l'utilisateur est tracé puis analysé avec une étude de corrélation sur les actions réalisées. Par exemple, si l'utilisateur a rapidement reformulé sa requête après un premier résultat, c'est que la première requête n'a pas été satisfaisante. A l'inverse, un clic pour repérer un établissement sur une carte est le signe que l'information transmise est a priori la bonne. Le coût du projet n'a pas été communiqué.