En avril dernier, une archive contenant 500 millions de données de Linkedin avait été mis en vente sur un forum. Bis repetita, mais cette fois-ci, la base de données contient 700 millions de données sur les utilisateurs du réseau social professionnel. L’alerte a été donnée après la publication le 22 juin dernier sur RaidForums d’un post d’un dénommé Tom Liner avec comme message, « j’ai 700 M 2021 d’enregistrements Linkedin ». Pas de prix fixé pour cette archive, mais le post indique « nous pouvons utiliser MM/escrow ».

Avec ce message, un échantillon comprenant 1 million de données était disponible en téléchargement. Le site PrivacySharks a analysé cet échantillon pour confirmer son authenticité. Il comprenait effectivement des noms complets, des adresses mails, des numéros de téléphone et des informations sur le secteur d’activité.

Pas de violation de données, mais du data-scrapping

Interrogé sur cette affaire, Linkedin a enquêté et a indiqué que l’ensemble des données comprend des informations obtenues par collecte sur Linkedin et d’autres sources. « Il ne s’agit pas d’une violation de données de Linkedin », martèle la filiale de Microsoft en ajoutant qu’« aucune donnée privée des membres n’a été exposée ». La technique du data-scrapping ou collecte de données en général par des robots n’est pas nouvelle, mais il s’agit « d’une violation de nos conditions d’utilisation », rappelle le réseau social professionnel.

Cette méthode a aussi été utilisée dans la base de données de 500 millions d’enregistrements Linkedin en avril dernier. Il est probable que des informations contenues dans cette base se retrouvent dans celle vendue le 22 juin dernier. Le dénommé Tom Liner n’en est pas à son coup d’essai, il avait déjà proposé une archive de 533 millions de données Facebook en avril.