MongoDB intègre nativement le reranking dans Atlas

L'éditeur de la base de données open source a décidé d'inclure nativement dans Atlas la technique de reranking qui trie les documents avant de les transmettre aux LLM . Selon les analystes, les DSI doivent évaluer les avantages et les compromis liés à cette annonce.

Pour améliorer la qualité de recherche par l’IA, MongoDB a annoncé l’ajout de la fonction de reranking au sein de sa base de données en mode hébergé Atlas. Cette technique consiste à réorganiser les documents récupérés pour ne garder que ceux qui apporteront le plus de valeur au modèle. Cependant, son déploiement posait quelques difficultés. En effet, il était nécessaire de faire appel à des fournisseurs distincts à des API et à des couches d’orchestration qui ajoutaient de la complexité. De même, la technique induisait des charges de gouvernance et des coûts à mesure de l’évolution des applications IA.

« Actuellement en préversion publique et optimisée par Voyage AI [ndlr : société acquise en 2025 et spécialisée dans le reclassement des données], la fonctionnalité baptisée « Native Reranking » s’exécute directement au sein du pipeline d’agrégation de MongoDB et peut améliorer la qualité de la recherche jusqu’à 30 % », a indiqué la société dans un communiqué.

Moins de travail pour les développeurs

Selon les analystes, cette annonce va réduire la charge de travail opérationnelle des développeurs, avec à la clef des gains de productivité. « Le reranking natif réduit le workload habituel des développeurs, avec comme impact immédiat une légère diminution du volume de code », note Mike Leone, analyste principal chez Moor Insights & Strategy. Il ajoute que « le bénéfice à long terme réside dans le fait qu’ils n’auront jamais à mettre en place de logique de nouvel essai, à gérer des échecs et des montées de version comme l’impose généralement un service de reranking distinct. Cette orchestration est invisible lors d’un test, mais devient un véritable fardeau une fois l’application en production », a déclaré Mike Leone, analyste principal chez Moor Insights & Strategy. De même, Stephanie Walter, responsable de la pratique IA Stack chez HyperFrame Research, a souligné que cette fonctionnalité donnera aux développeurs la possibilité de consacrer moins de temps à l’interconnexion de l’infrastructure et davantage à l’amélioration du comportement des applications.

Cette réduction des charges techniques aura également un impact positif sur les responsables IT des entreprises, principalement les DSI, chargés de gérer l’infrastructure IA. « Pour les DSI, le reranking natif est précieux car il simplifie la pile IA. Chaque service IA supplémentaire crée un élément à gérer, à sécuriser, à surveiller et à payer », a pointé Mme Walter. « Même si le fait de rapprocher le reranking des données ne supprime pas toute la complexité architecturale, ce rapprochement réduit l’un des points de transfert où la qualité de la recherche, la fraîcheur des données et le contrôle opérationnel peuvent être compromis », a ajouté Mme Walter. « Pour les DSI, l’intérêt est davantage d’ordre stratégique », a estimé pour sa part Ashish Chaturvedi, responsable de la recherche exécutive chez HFS Research. « La plupart des entreprises citent le manque de précision comme principal risque lié à l’IA à mesure que son adoption prend de l’ampleur », a poursuivi l’analyste. « Un rangement amélioré renforce la confiance dans l’infrastructure, car les entreprises ne veulent pas donner plus de pouvoir décisionnel aux agents IA sauf si elles peuvent se fier à la qualité des informations que ces systèmes extraient et sur lesquelles ils raisonnent », a-t-il expliqué.

Réduire le coût de l’IA d’entreprise à l’échelle

Comme l’ont aussi souligné les analystes, au-delà de la simplification du développement et des opérations, le « Native Reranking » pourrait également aider les DSI à réduire les coûts opérationnels liés à la mise à l’échelle de l’IA, un domaine qui reste un défi majeur pour les entreprises. Selon Mme Walter, l’optimisation de la recherche s’impose comme l’un des leviers les plus concrets pour maîtriser les dépenses liées à l’IA, car la réduction du contexte non pertinent diminue la consommation de tokens. « Le raisonnement est le suivant : chaque passage que l’on envoie au modèle est un élément qu’il doit lire et analyser à l’aide de ressources de calcul GPU coûteuses, et ce coût augmente proportionnellement à la quantité de données qu’on lui fournit.

En éliminant les passages non pertinents avant qu’ils n’atteignent le modèle, on cesse de payer le tarif des modèles de pointe pour analyser un contexte qui n’aurait jamais eu d’importance », a renchéri M. Chaturvedi. « À mesure que les entreprises adoptent des modèles plus volumineux et plus coûteux, le coût du contexte enrichi augmente rapidement. Et à l’ère des agents, le calcul s’aggrave, car une mauvaise recherche ne produit pas seulement une mauvaise réponse. Elle déclenche plutôt une étape erronée, une autre tentative et une autre série de jetons sur l’ensemble de la trajectoire », a-t-il détaillé.

Des compromis potentiels

Malgré tous les avantages de productivité, d’intégration et de coût, le « Native Reranking » s’accompagne, selon les analystes, d’une série de compromis potentiels. « La simplification même de la pile IA d’entreprise qu’offre aujourd’hui cette technique peut se transformer plus tard en dépendance vis-à-vis d’un fournisseur », a mis en garde M. Leone, ajoutant qu’il peut augmenter le coût d’un changement de plateforme ultérieur. Igor Ikonnikov, consultant chez Info-Tech Research Group, voit une autre limite : selon lui, la valeur du « Native Reranking » dépend du fait que MongoDB serve ou non de référentiel de données principal pour l’entreprise. « Les entreprises dont les données sont réparties sur plusieurs référentiels peuvent encore avoir besoin d’une orchestration intersystèmes ou d’une optimisation centralisée de la recherche plutôt que de s’appuyer uniquement sur les capacités natives de la base de données », a-t-il justifié.

Selon les analystes, ces compromis montrent également que les DSI devraient éviter d’évaluer les technologies de recherche exclusivement sur la base de la précision de la recherche. Au contraire, selon Mme Walter, les responsables IT devraient apprécier les plateformes en fonction de leur capacité à trouver un équilibre entre la précision de la recherche, la simplicité opérationnelle, la gouvernance, la latence et l’actualité des données. De même, M. Chaturvedi fait remarquer que les DSI devraient de plus en plus évaluer le coût total de possession, y compris l’effort d’ingénierie nécessaire pour maintenir la qualité de la recherche, la consommation de jetons et le nombre de points de défaillance opérationnelle introduits par l’architecture.

Une évolution plus large vers des plateformes IA intégrées

Cette évolution plus large dans la manière dont les DSI devraient évaluer les offres d’infrastructure IA influence aussi la façon dont les fournisseurs d’entrepôts de données et de bases de données modifient leurs plateformes. Au cours des derniers mois, EnterpriseDB (EDB), pgEdge et Databricks ont tous lancé des architectures capables de regrouper les capacités IA, transactionnelles et analytiques au sein de leurs plateformes de données respectives, réduisant ainsi les mouvements de données et le nombre de systèmes que les entreprises doivent intégrer et gérer.

Leone pense que, après une première vague de déploiements de GenAI consacrée à assembler de multiples services spécialisés à l’origine d’une complexité opérationnelle qui a souvent ralenti les déploiements en production, cette évolution s’inscrit dans le cadre d’une réorientation plus large du secteur. Pour M. Chaturvedi, l’IA d’entreprise s’éloigne d’un modèle « nécessitant un assemblage » pour s’orienter vers des plateformes intégrées regroupant les capacités IA fondamentales, alors que les entreprises cherchent à réduire les coûts d’intégration associés aux piles d’IA multi-fournisseurs.