A l'image d'autres services de réseautage social, LinkedIn a rendu public le code d'un logiciel récupéré suite à l'achat d'IndexTank en octobre de cette année. Le réseau social professionnel en ligne LinkedIn a ainsi cédé à la communauté Open Source un moteur de recherche développé par l'éditeur. « Nous sommes impatients de voir IndexTank se développer comme projet Open Source, » a écrit Diego Basch, le directeur de l'ingénierie de LinkedIn, et ancien PDG d'IndexTank, dans un blog dans lequel il a annoncé la nouvelle.

Lors de l'acquisition, LinkedIn avait fait savoir qu'il était intéressé par le logiciel d'IndexTank, et que ses ingénieurs souhaitaient améliorer ses fonctions de recherche pour l'intégrer au propre site web du réseau social. IndexTank a mis en oeuvre des systèmes de recherche pour des sociétés Internet comme Reddit, le site Automattic de WordPress, BitTorrent ou encore TaskRabbit.

D'autres entreprises web sont passées au libre

Mais LinkedIn a décidé, comme d'autres entreprises de service web du secteur, de céder le code source de cette version. Plus récemment, Twitter a rendu Open Source sa technologie de cryptage mobile TextSecure et a libéré son système Storm de traitement de flux de données et de calcul distribué en temps réel, deux technologies acquises avec d'autres rachats d'entreprise.

Quant à eBay, le géant de l'internet a directement lancé son langage de programmation Internet, Ql.io, en version publique plus tôt ce mois-ci. Également publiés en Open Source, le logiciel de mise en cache de données de LiveJournal, ou encore l'outil d'agrégation de log Scribe de Facebook et le SPDY de Google pour remplacer le HTTP. Tous ces logiciels ont fait la joie de la communauté des services Internet et ils sont très répandus.
Pour sa part, IndexTank a trois composantes. La première est un moteur de recherche en texte intégral et d'indexation, appelé IndexEngine. Celui-ci peut évaluer les résultats en termes d'entrées générées par les utilisateurs, comme le partage ou l'évaluation d'un document. Le pack inclut également une API qui permet d'interagir avec IndexEngine à travers Java, Python, PHP et d'autres langages de programmation. Nebulizer est un composant optionnel du pack. C'est un framework pour gérer des index multiples que l'on peut proposer comme des services.

D'autres modules disponibles en Open Source

LinkedIn a également publié un certain nombre d'autres technologies de recherche en Open Source. C'est le cas de Bobo, une extension Java pour Apache Lucene qui peut chercher des données semi-structurées, ou encore de Zoie, un moteur de recherche en temps réel construit sur Lucene. Et Cleo, une bibliothèque pour des services de saisie automatique de formulaires.

IndexEngine, et son logiciel associé, a été publié sous licence Apache 2.0, et est disponible auprès de GitHub.