Le lien entre open data et IA est en train de s’opérer pour Data.gouv.fr avec l’expérimentation d’un serveur MCP. Cet acronyme pour Model Context Protocol est un standard (récemment intégré à l’Agentic AI Foundation) développé par Anthropic pour connecter les assistants et les agents IA à des outils et des données externes. Dans un premier temps, l’administration précise que son serveur MCP fonctionne uniquement pour explorer les données publiques ouvertes en lecture, sans autoriser de modification. Elle envisage à terme des usages pour éditer et publier de nouvelles données sur la plateforme.
Le serveur comprend plusieurs outils pour accéder aux jeux de données et aux services API du site (la base Sirene, les personnes décédées, les demandes de valeurs foncière,...) :
- search_datasets : rechercher des jeux de données ;
- get_dataset_info : accéder aux métadonnées d’un jeu de données ;
- list_dataset_resources : lister les ressources associées ;
- get_resource_info : consulter les métadonnées d’une ressource ;
- query_resource_data : interroger directement certaines données ;
- download_and_parse_resource : télécharger et analyser une ressource ;
- get_metrics : accéder à des indicateurs d’usage.
Une démarche prudente
Avec cette expérimentation, l’administration veut savoir ce qu’apporte ce protocole apporte aux données publiques. Elle appelle à la prudence à plus d’un titre. Ansi, elle précise ainsi que les modèles de langage peuvent produire des réponses incomplètes, approximatives ou erronées. Par ailleurs, elle alerte sur l’existence de nombreux serveurs MCP non officiels qui se présentent comme liés à data.gouv.fr.
Le code du serveur est disponible sur GitHub. Il est compatible avec plusieurs modèles IA comme ChatGPT, Claude desktop et code, Mistral Vibe CLI, Gemini CLI, Cursor, Bob d'IBM, Windsurf,... L'administration attend maintenant des retours sur les premiers usages pour affiner son test.

Commentaire