Le site Wikileaks a livré hier des fichiers confidentiels sur la Syrie, les « Syria Files ». Cette base de données contient plus de 2,4 millions d'emails échangés entre août 2006 et mars 2012 par des personnalités politiques, des ministères et des entreprises syriennes. « Les 2 434 899 d'e-mails ont été récoltés auprès de 680 institutions syriennes », a déclaré Sarah Harrison, l'analyste responsable du projet, à Londres, au cours d'une conférence de presse. « Ces courriels comportent des informations provenant des ministères syriens des Affaires Présidentielles, des Affaires étrangères, des Finances, de l'Information, des Transports et de la Culture », a t-elle ajouté.

« Les Syria Files éclairent sur le fonctionnement du gouvernement syrien et sur les rouages de l'économie du pays, mais elles portent aussi au grand jour l'attitude des entreprises occidentales, qui disent une chose d'un côté et font autre chose par ailleurs», a déclaré Sarah Harrison. La base de données contient des informations émises par 679 000 adresses e-mails environ, à destination de plus de 1 million de bénéficiaires. « Au total, la quantité de documents rendus public est huit fois plus importante que celle du « Cablegate » - les câbles diplomatiques américains divulgués par l'intermédiaire du site. Cela représente 100 fois plus de données en volume », a encore ajouté l'analyste. Celle-ci n'a pas donné de détails sur la façon dont Wikileaks s'était procuré ces informations auprès de ces sources aussi disparates.

Une gestion de big data

Pour gérer ce très gros volume de données, « Wikileaks a mis en place un système de consultation en plusieurs langues capable de gérer des quantités massives de données, comme c'est le cas des fichiers syriens », a ajouté Sarah Harrison. Les e-mails sont rédigés dans des langues différentes. « Environ 400 000 e-mails sont écrits en arabe et 68 000 en russe », a t-elle précisé. Wikileaks fournit la traduction en anglais, en allemand, en espagnol et en français. « Nous travaillons sur des fonctionnalités supplémentaires pour améliorer le système », a ajouté Mme Harrison. « Etant donnée l'ampleur du nombre de courriers électroniques, il n'a pas été possible de vérifier chaque e-mail un par un », a encore déclaré Sarah Harrison. Mais l'association a estimé que, «statistiquement, la grande majorité des données reflétaient ce qu'elles prétendaient être », a t-elle ajouté.

La première série de courriels divulgués concerne un intégrateur de systèmes radio numérique, Selex SI. Dans les échanges, il y est question de la vente et du support des radios numériques cryptés et des stations émettrices-réceptrices TETRA, des matériels généralement utilisés par les forces de police. « Les données montrent que la vente, la maintenance et la formation fournie par l'entreprise Selex SI se sont poursuivies jusqu'à cette année », a déclaré Sarah Harrison. Sur son site internet, Wikileaks fournit des liens vers les emails au format texte, plus un lien vers un fichier torrent permettant de télécharger les messages.