« En 2014 et 2015, on a commencé à se dire qu'on pouvait faire quelque chose avec du GPU. En 2016, on a commencé à en utiliser et en 2017, on est passé à ça pour remplacer nos serveurs X86 et répondre à nos besoins en big data et intelligence artificielle », raconte Eric Léandri. Et c'est avec Nvidia que Qwant vient de franchir le Rubicon du GPU et plus précisément en se portant acquéreur d'un serveur DGX-1. « Ils ont créé un serveur regroupant 8 cartes connectées avec un nouveau bus. Tout va 5 fois plus vite et le nombre d'opérations en temps réel est multiplié par 8 », précise Eric Léandri, président et fondateur de Qwant.

Le serveur DGX-1 fourni à Qwant est livré préinstallé avec plusieurs frameworks en deep learning dont Tensor Flow (librairie logicielle pour le calcul numérique développée par Google), Caffe (framework deep learning modulaire créé par le Berkeley Vision and Learning Center) ainsi que Torch (framework de calcul scientifique proposant un support étendu des algorithmes pour l'apprentissage machine). « Nvidia n'a pas pour habitude de traiter en direct avec tous ses clients et c'est ce que nous faisons avec Qwant », indique de son côté Serge Lemonde, directeur commercial Europe du Sud et Moyen-Orient de Nvidia. « On ne vend pas seulement à Qwant un produit mais aussi, en support, des architectes en réseaux neuronaux ». Le serveur DGX-1, qui a coûté à Qwant 180 000 euros (avec trois ans de support), embarque 8 GPU - délivrant une puissance de calcul brute de 170 Teraflops - et 7 To de SSD. Chaque GPU dispose de 16 Go de RAM.

Speech to text, reconnaissance d'images et traitement optimisé du spam

Désormais adossé aux technologies Nvidia pour ses besoins en puissance de calcul pour ses projets IA - ses précédents systèmes X86 étant réutilisés pour des besoins secondaires - Qwant travaille sur de nouveaux chantiers de développement. Le premier touche au speech to text permettant d'extraire et d'analyser 30 minutes de contenus vidéo en 3 minutes. Objectif : permettre à des internautes de retrouver, via une recherche plein texte, un ou plusieurs extraits vidéos dans lesquels les mots-clés saisis sont précisément évoqués dans la bande son mais aussi dans l'image. Nous avons pu assister à un test basé sur le contenu d'un journal télévisé de TF1 avec la recherche « Hollande guerre » et le résultat a plutôt bien fonctionné. Pour Qwant, le problème reste maintenant moins lié à un aspect technologique que de contenus. Car la pertinence de la technologie ne servira pas à grand chose s'il n'est pas possible d'y adosser de nombreux flux. La société française avance que son service sera lancé en juin avec « quelques flux » pouvant être tirés de You Tube ou de Dailymotion, voire de chaînes du service public. Sur ce point, Qwant se montre encore toutefois flou, de même que sur la monétisation. « Il n'est pas question de sortir notre carnet de chèques pour acheter des flux », prévient Eric Léandri. La société est en fait plutôt amenée à se tourner vers un partage d'un « certain pourcentage » publicitaire au clic avec les diffuseurs, reste à savoir cependant lesquels...

Le surcroît en puissance de calcul et capacités deep learning de Qwant servira à exploiter plus efficacement ses algorithmes maison dédiés aussi bien à l'analyse d'images qu'à la lutte contre le spam. « Le moteur Qwant Junior [lancé en 2015 et destiné aux enfants] va pouvoir mieux reconnaitre les images violentes et pornographiques pour empêcher de les afficher », fait savoir Eric Léandri. Qwant Junior ne part pas de rien dans ce domaine. Par exemple, lors des attentats terroristes du 13 novembre 2015, une requête sur Paris affichait des résultats de recherche avec des photos de la Tour Eiffel et pas ceux des morts ou blessés des attentats. Après un test, ce moteur livre toutefois encore, sur certaines requêtes, quelques images pouvant heurter la sensibilité des plus jeunes. 

De l'hébergement cloud en France pour les clients qui le souhaitent

Outre un serveur DGX-1 pour son usage interne, Qwant a également fait l'acquisition de 10 autres modèles qui vont être utilisés pour son nouveau service cloud de puissance de calcul deep learning à la demande. Destiné aux start-ups, essentiellement dans le domaine de l'intelligence artificielle pour la santé et le biomédial, il sera proposé à 9 500 euros par mois. Un service proposé pour répondre à des besoins de test et qui n'a pas vocation à devenir un service récurrent pour les start-ups. C'est une façon de mettre le pied à l'étrier à ces dernières qui pourraient ensuite acheter un serveur DGX-1 et non continuer à le louer. On comprend bien pourquoi, car au bout de deux ans, la location revient en effet aussi cher que l'achat. La société française est par ailleurs prête à proposer une prestation d'hébergement cloud pour les clients que le souhaitent.

Au-delà de ses nouvelles capacités en deep learning, Qwant mise également sur son ADN 100% français pour faire la différence. Si dans le passé, on se rappelle que cela n'avait pas vraiment porté chance à d'autres (Dazoo, Premsgo ou encore Voilà - anciennement Echo lancé en juillet 1998, racheté par Orange et depuis 2016 fermé et remplacé par le moteur en-ville.orange), la société veut croire en sa bonne étoile. « Les gens sont inquiets de voir leurs données partir à l'étranger, nous sommes le seul à proposer un moteur respectueux de la vie privée et des données personnelles avec des données hébergées en France, dans notre cloud chez Equinix », résume Eric Léandri.

Vers un quadruplement des effectifs d'ici fin 2018

Créé en 2013, le moteur de recherche français Qwant (disponible en 25 langues) s'est donné de nouveaux moyens financiers pour assurer son développement en parvenant à lever 18,5 millions d'euros. Si la société évalue sa part de marché à 2% en France, contre près de 95% pour Google, elle espère toujours grimper à 5-10% dans les deux prochaines années. D'ici fin 2017, Qwant mise sur un chiffre d'affaires compris entre 8 et 10 millions d'euros, provenant en très grande partie de l'affiliation, et va accroître ses effectifs de façon très significative cette année. Il compte passer d'une soixantaine de personnes aujourd'hui à 80 fin juin pour atteindre 150 en décembre. Et ce n'est pas fini car, fin 2018, la start-up pense atteindre les 250 collaborateurs. Les recrutements prévus se feront pour l'essentiel dans le domaine de l'ingénierie et du développement et dans la sécurité, respectivement sur ses sites de Nice et de Rouen.