Les start-up vont-elles permettre à SAP de se faire connaître, voire reconnaître, au-delà de son territoire ? C'est sans nul doute l'un des objectifs recherchés par l'éditeur allemand en approchant ces jeunes pousses pour leur proposer, non seulement un accès gratuit à sa base de données in-memory HANA, mais aussi un suivi technique et marketing pour vendre l'offre qui en résultera. Les fondateurs de ces start-up, innovants mais peu argentés, ne sont guère enclins à se tourner vers des solutions propriétaires, trop coûteuses et qui, de surcroît, risquent aussi de verrouiller leurs offres.

« Une start-up consomme a priori de l'Open Source », rappelait sur Sapphire la semaine dernière Cyrille Vincey, PDG de Qunb, l'une des sociétés retenues par SAP dans son programme Startup Focus. « D'ailleurs, lorsqu'un investisseur s'intéresse à l'une d'elles, il lui demande si elle est propriétaire de sa technologie », faisait-il en outre remarquer. Partant de ce postulat, le co-fondateur de Qunb est d'accord pour mettre la technologie de SAP en périphérie de son offre, « mais jamais au centre de notre architecture parce qu'elle n'est pas Open Source ». Sa société, co-fondée avec Jean-Baptiste Théard, actuel CTO, fait pourtant partie de la vingtaine de start-up mises en avant sur la marketplace ouverte par l'éditeur allemand à l'occasion de sa conférence européenne (organisée à Madrid du 13 au 16 novembre).

Lancé il y a cinq mois à peine, le programme Startup Focus a conduit SAP à sélectionner 153 start-up au niveau mondial sur 17 pays. Ces projets couvrent 22 secteurs d'activité différents et 9 domaines fonctionnels (BI, CRM...) et pour cinquante d'entre eux, des démonstrations ont déjà pu être montées avec HANA, a  précisé lors d'un entretien, à Madrid, Kaustav Mitra, vice-président, responsable du programme Startup Focus chez SAP. Parmi les start-up finalistes, treize sont françaises, huit situées à Paris et cinq autres dans la région de Nice.

Miser sur HANA pour les données à forte dimensionnalité

Arborant comme baseline « Quantities & Numbers », Qunb a construit un site d'agrégation de données quantitatives, informations publiques issues de la démarche Open Data ou provenant d'études de marché (partenariats avec OpinionWay, Kantar notamment). Son ambition : démocratiser l'accès à la donnée professionnelle, rendre l'étude de marché accessible. « Nous proposons de la visualisation de données interactive », décrit Cyrille Vincey. Plusieurs trillions de points de données sont agrégés par Qunb, gérés dans un cluster Hadoop et accessibles via un portail web. « Voyez nous comme le 'premier dataservice for the masses' », éclaire le PDG. « Nous permettons à des professionnels de comparer rapidement ces données publiques avec leurs données internes ». Démarré il y a deux ans, incubé au sein du Camping, « un accélérateur de start-up » qui lui a permis de lever des fonds(*), le projet s'est retrouvé finaliste lors de la Strata Conference de New York (associée à Hadoop World), et sélectionné pour le Web'12 Paris. A long terme, l'objectif de Qunb est d'établir un modèle économique sur la vente de données à la découpe, via des partenariats avec des producteurs de données.

La solution de Qunb s'appuie donc sur une architecture distribuée. Son cluster Hadoop pré-calcule toutes les combinaisons d'agrégation possibles entre les données et les stocke sur des disques. « C'est possible quand il s'agit de données à faible dimensionnalité », ce qui est généralement le cas pour les informations publiques. En revanche, les données d'entreprise ont une très forte dimensionnalité et peuvent être combinées de façon explosive (alimentation de la base en temps réel, segmentations flexibles...). C'est là où l'approche distribuée basée sur les disques trouve ses limites et où la plateforme HANA peut avoir un rôle à jouer.  A cela s'ajoute le caractère confidentiel des données d'entreprise qui requiert de les conserver en interne plutôt que de les transférer dans le cloud. Approché par SAP, Qunb a donc développé un connecteur pour les utilisateurs de la base in-memory afin d'y effectuer les calculs quasi instantanément dès lors qu'il s'agit d'inter-comparer les données internes et publiques. Mais, en dehors des entreprises qui utilisent déjà HANA, Cyrille Vincey n'est pas certain de pouvoir faire gagner d'autres clients à SAP, par la seule force de sa solution.

POC développé par Qunb pour exploiter la technologie HANA de SAP
Le Proof of Concept réalisé par Qunb avec SAP HANA


Dix jours/homme investis dans l'aventure HANA

Pris sous l'aile de l'équipe du programme Startup Focus de Palo Alto, rencontrée à New York sur la Strata Conference, Qunb a développé assez facilement son connecteur HANA, jugeant l'environnement bien documenté, flexible, assez ouvert. Mais pour l'instant, l'aventure reste en stand-by dans l'attente d'un client qui conduirait la jeune pousse française à s'y investir plus avant. « Nous y avons investi une dizaine de jours/homme, c'est beaucoup pour une start-up », a souligné Cyrille Vincey. D'autant que le co-fondateur de Qunb n'est pas encore totalement convaincu par le tout in-memory, même s'il reconnaît la vitesse stupéfiante apportée par HANA sur les calculs. Mais pour lui, le disque est loin d'avoir dit son dernier mot et il restera toujours moins cher que la mémoire vive, même si celle-ci est indéniablement intéressante pour certaines applications. Il observe que le monde de l'Open Source et, par conséquent, les acteurs qui exploitent ces projets ouverts, continuent à explorer des technologies reposant sur les architectures distribuées et les disques. Il évoque notamment les recherches menées par Google avec son architecture Dremel qui vient compléter les traitements MapReduce, ou encore la base données graphique Open Source Druid, à surveiller de près.