On connaissait déjà l'efficacité de Google à annoncer une épidémie de grippe en analysant les recherches effectuées sur ce moteur. Grâce à l'essor conjoint des média sociaux et de l'analyse de grands volumes de contenus non structurés (big data), on nous promet quantité de renseignements, voire même de prédictions dans une foule de domaines, à même d'intéresser tant les responsables marketing que les sociologues. Trois études basées sur l'analyse de données de Facebook et de Twitter montrent le potentiel et les limites de la démarche.

Les jours et les saisons des amours

La première étude émane de deux analystes de Facebook, qui se sont intéressés aux changements de situation amoureuse déclarés par les membres du réseau (utilisateurs américains, données 2010-2011). Dans leur papier publié sur le blog de Facebook, ils expliquent avoir comparé pour chaque jour la différence entre le nombre de personnes se mettant en couple et le nombre de personnes ayant cessé une relation. Des données qui leur ont permis de déterminer la temporalité des amours, durant l'année et la semaine.

Il en ressort que les jours les plus favorables aux amours sont d'abord la Saint-Valentin (49%) et Noël (34%). Plus surprenant, le 1er avril est le cinquième jour le plus favorables aux relations, alors que le 2 avril est le jour où le plus de couples semblent rompre. Tout au long de l'année, et quel que soit le groupe d'âge observé, l'été est la saison la moins favorable, le nombre de ruptures dépassant celui des nouveaux couples. Enfin, d'après l'analyse par jour de la semaine, les couples se formeraient suite au weekend, alors que l'arrivée du weekend est plutôt néfaste aux romances (voir graphique).

Anticiper les changements boursiers avec Twitter

La seconde étude s'est penchée sur la corrélation entre l'évolution d'un titre boursier (volume de transactions, prix) et les messages publiés sur Twitter. Les chercheurs ont analysé pour ce faire les messages portant soit directement sur une société cotée soit sur des termes connectés (par exemple le nom des produits de la société en question). Ils ont ainsi constaté une corrélation de la densité de ces messages avec le volume de titres échangés et, dans une moindre mesure, avec le prix du titre.