Tous les opérateurs possédant des réseaux enterrés ne connaissent que trop la problématique du coup de pelleteuse malencontreux, qui endommage un actif enterré. Le sujet est sensible chez GRDF, du fait des risques de sécurité que ces erreurs soulèvent obligatoirement chez un opérateur spécialisé dans le transport du gaz. D'où l'intérêt des analyses de données permettant, via la construction d'un modèle prédictif dédié, de réduire les risques. En France, tous les travaux à proximité des réseaux enterrés font l'objet d'une déclaration préalable réalisée par le responsable du projet ainsi que d'une déclaration d'intention de commencement de travaux (DICT), par l'exécutant en charge du chantier. Ce formulaire Cerfa, qui renferme environ 150 données par chantier (nature des travaux, techniques employées...), est transmis électroniquement aux opérateurs de réseaux qui y répondent avec les plans de leurs installations concernées par l'empreinte du chantier ainsi qu'avec leurs recommandations en fonction de la nature de l'ouvrage.

Cibler les visites de contrôle sur les chantiers à risque

« Mais cela ne suffit pas à éliminer tous les risques, par exemple lorsque les faisceaux d'incertitudes concernant l'emplacement d'un équipement ne sont pas respectés », observe Jean de la Fayolle, responsable Data Science de GRDF, qui s'exprimait récemment lors d'un événement organisé par l'éditeur Dataiku. D'où l'idée de bâtir un modèle prédictif, permettant de mieux cibler les visites de chantiers que mènent les inspecteurs de GRDF. Pour ce faire, l'opérateur chargé d'acheminer le gaz sur les réseaux de distribution a commencé dès 2020 à entraîner des modèles sur différentes données complémentaires : les données non structurées des déclarations de travaux, les données spatiales sur la base des déclarations d'emprise, les données issues de la cartographie des réseaux (permettant de préciser, par exemple, si une canalisation est protégée, l'année de son installation, etc.) et l'historique des dommages.

Jean de la Fayolle, responsable Data Science de GRDF : « en visitant seulement 4% des chantiers, nous parvenons à cibler 50% des dommages futurs ». (Photo : R.F.)

Depuis 2023, le méta-modèle ainsi construit - et qui regroupe différents modèles ciblant des données de différentes natures - analyse en direct les 5 000 à 6 000 déclarations que reçoit GRDF chaque jour, afin de prédire les risques de dommages, via un scoring quotidien des chantiers. « En visitant seulement 4% des chantiers, nous parvenons à cibler 50% des dommages futurs », dit Jean de la Fayolle.

Traiter les déséquilibres de classes

Mis au point dans Dataiku, outil que GRDF exploite depuis le milieu des années 2010, le modèle prédictif a été complexe à entraîner du fait du faible nombre de dommages réels par an. « Il a fallu traiter les déséquilibres de classes (ce augmente nettement la difficulté de l'apprentissage par l'algorithme de classification, NDLR) et intégrer peu à peu de la connaissance métier, qui s'est avérée très utile pour améliorer le modèle », précise le responsable Data Science. En 2021 et 2022, l'opérateur a ainsi travaillé aux itérations de son modèle, avant d'en exploiter les résultats dans un tableau de bord. GRDF prévoit d'intégrer, dès 2024, le scoring directement dans son application de visite de chantiers (Protys), afin d'en faire un outil plus proche du terrain et d'en optimiser la valeur.