Amazon Web Services aime la France et compte bien le faire savoir. Afin de faire passer le message, le fournisseur américain a profité de la tenue de son événement Summit Paris 2016 pour dégainer un festival de retours d'expérience bien du terroir, non seulement sur la scène du Caroussel du Louvre, mais également en coulisses à l'occasion d'un déjeuner-presse organisé dans la foulée de la matinée d'ouverture. « Plus de 80% du CAC40 utilise AWS de façon significative », a lancé pendant la keynote du matin Werner Vogels, vice-président et directeur d'AWS à l'attention des 2 000 personnes présentes sur l'événement, essentiellement des clients et partenaires.

Pour marquer le coup à l'occasion de son show, Werner Vogels a d'ailleurs réussi habilement à se mettre le public dans sa poche en annonçant la disponibilité prochaine de son service de connectivité réseau Direct Connect opéré depuis Paris via un de ses partenaires. Parmi les multiples retours d'expériences égrainés tout au long de la journée, deux ont particulièrement retenu l'attention de la rédaction, initiés par la Mairie de Paris et par le spécialiste français des petites annonces en ligne, leboncoin.

48 millions d'enregistrements et 172 jeux de données à la Mairie de Paris

Lancée en 2011 dans un projet open data, la Marie de Paris ne disposait pas jusqu'alors d'une plateforme permettant de traiter de façon décentralisée l'ensemble de ses données dont le volume n'a cessé de croître. « Aujourd'hui, nous mettons à disposition 48 millions d'enregistrements et 172 jeux de données, et 1,5 million de téléchargements ont été effectués », a indiqué Awa Ndiaye, chef de projet Open Innovation à la Mairie de Paris lors de l'AWS Summit Paris 2016. « Nous sommes passés à Opendatasoft en mode SaaS ». Et c'est vers AWS que la Mairie de Paris s'est tournée pour héberger sa solution qu'elle estime aujourd'hui suffisamment modulaire et agile pour s'adapter à ses besoins. A ce jour, des millions de données sont désormais accessibles concernant aussi bien les 178 000 installations d'éclairage public, que les 90 000 arbres ou les 2 000 abribus parsemant la capitale. Mais la mairie ne compte pas s'arrêter là : « Nous installons sur la Place de la Nation différents capteurs de flux, de gaz, d'eau, des sonomètres, qui vont servir à la réaménager pour s'adapter à la vie des Parisiens », poursuit Awa Ndiaye. « On place la donnée à Paris au coeur de la démarche smart city ».

Le projet Open Data de la mairie de Paris constitue une première étape de sa démarche smart city qui débute à la place de la Nation. (crédit : Dominique Filippone)

Créé en 2006, leboncoin a presque mis pendant des années un point d'honneur à ne pas s'exposer sur le devant de la scène médiatique. Comptant aujourd'hui 400 personnes - dont 100 rien qu'à la DSI - le plus grand site français de petites annonces a fini par s'ouvrir et joue aujourd'hui plus que jamais la carte de la transparence. Soutenu par le groupe suédois Schibsted, leboncoin occupe une place singulière sur le marché du web en France avec une capacité, selon la société, à toucher au moins une fois dans l'année 2 français sur 3. Le secret de sa réussite ne se résume pas à ses flux d'annonces plus qu’éclectiques et en tous genres (voitures, emplois, consoles de jeux...) mais surtout à sa capacité à gérer, stocker et traiter une monstrueuse volumétrie de données. 

Aissa Belaid, directeur de l'activité data du spécialiste français des petites annonces en ligne leboncoin. (crédit : Dominique Filippone)

« Leboncoin, c'est aujourd'hui un flux de 26 millions d'annonces en stock et un dépôt quotidien de 800 000 annonces pouvant atteindre en pic 1,2 million », nous a indiqué Aissa Belaid, directeur de l'activité data du boncoin. Entré dans la société en 2010 par la porte de la relation client et chargé d'équiper les centres d'appels français gérés en propre de solutions ad hoc, Aissa Belaid a très vite été amené à s'occuper d'autres tâches liées notamment à l'évolution du back office, de l'ERP, du CRM et puis de l'exploitation des données. « En 2012, on a senti que la BI ne nous amènerait plus très loin, nous avons donc réfléchi à une stratégie à plus long terme », explique le directeur. Il est alors question d'unifier toutes les compétences data en montant un centre d'excellence qui est aujourd'hui constitué d'une vingtaine de personnes (informaticiens, codeurs, spécialistes de la donnée). « Pendant longtemps, les données non exploitées étaient considérées comme des déchets et tout le travail effectué a consisté à trouver les moyens de les recycler et de les valoriser », poursuit Aissa Belaid. 

Au coeur du projet data du boncoin, plusieurs technologies coexistent. Pour le traitement et l'exploitation des données, la société a ainsi choisi de se reposer sur des solutions internes basées sur des briques open source, mais pas seulement. « On fait du big data avec Apache Kafka et Spark, avec du stockage en colonnes des données sur Amazon S3 », indique Aissa Belaid. Une infrastructure qui permet à la société de traiter 45 teraoctets de données en 15 heures. Concernant les autres briques déployées pour soutenir ses projets cloud et data, on notera le recours à EC2 et Lambda pour du compute, S3 pour le stockage (étendu à 100 To d'ici fin 2016), ou encore RDS PostgreSQL et Redshift pour son datawarehouse contenant jusqu'à 10 To de données, sans compter Kinesis (analytique). « Nous sommes passés d'une problématique d'archivage des données à celle de la conservation des données pour mieux les exploiter », a fait savoir Aissa Belaid.