Depuis fin 2023, la société de test, d'inspection et de certification pour l'industrie, le BTP et l'infrastructure Socotec s'est dotée d'un data et IA hub. Une structure transverse entièrement vouée à la data et à l'IA destinée à acculturer les équipes métier et à les impliquer avec l'IT dans des projets stratégiques. Raphaël Leclerc, directeur de la data, pilote ce data et IA hub sous la double tutelle de la DSI groupe et de la direction des infrastructures France et Moyen-Orient (direction des opérations). « Cette structure est née ex nihilo, raconte-t-il. Elle s'est auto-construite à partir d'un cas d'usage sur lequel j'ai travaillé dans le métier du monitoring d'infrastructures (rachat de Cementys en 2020, dont Raphaël Leclercq est issu, NDLR). »

Et les objectifs de la démarche sont multiples ! En premier lieu, Socotec veut faire prendre conscience à tous ses employés de l'importance de la donnée. « C'est un actif essentiel dont il faut prendre soin comme de nos bâtiments », insiste Raphaël Leclercq. Il s'agit ensuite d'améliorer la gouvernance des processus et de la responsabilité de la data pour l'ensemble des usages, et tout particulièrement l'entrainement des modèles d'IA.

Bien sûr, un autre défi réside dans la mise en place d'une infrastructure technique cohérente pour réaliser des POC (proof of concept) avec les données de l'entreprise, mais aussi des données externes issues notamment de l'open data. Il s'agit également d'augmenter la qualité de la donnée dans l'entreprise pour la dataviz et la BI, mais aussi pour les projets d'IA. Le data et IA hub doit aussi identifier les cas d'usage cohérents avec l'activité. Enfin, il a la charge de développer des écosystèmes de partenariats. « Nous avons trois niveaux d'écosystèmes partenaires, précise le directeur data. Le monde académique pour l'IA appliquée au métier, avec l'ENS Paris Saclay, mais aussi Polytechnique Milan, Supelec, etc. Les entreprises de la technologie, comme celles du cloud. Et, enfin, des startups par le biais de structures comme le Hub FranceIA. »

Une IA pour l'inspection des défauts des ouvrages

Même si le hub n'a été formalisé que fin 2023, deux POC (proof of concept) basés sur l'IA ont déjà été déployés sur des cas d'usage très concrets. Le premier, Sofia (Surveillance des ouvrages fondée sur l'IA), aide les inspecteurs de Socotec à détecter les défauts des ponts pour la Société des autoroutes du nord et de l'est de la France (Sanef). Le second, Aurelia (oreille en latin, avec le suffixe IA), identifie les équipements sources de nuisance sonore sur les chantiers. Pour Sofia, financé par le plan France Relance, l'équipe de Raphaël Leclercq travaille depuis deux ans en partenariat avec le CEA List (laboratoire des systèmes intelligents du CEA, NDLR) et son client, la Sanef, qui gère environ 3000 à 5000 ouvrages.

Raphaël Leclerc, directeur de la data de Socotec, pilote le data et IA hub de l'entreprise sous la double tutelle de la DSI groupe et de la direction des infrastructures France et Moyen-Orient. (Photo DR)

L'objectif est de transformer l'acte d'inspection pour les inspecteurs eux-mêmes, avec deux enjeux principaux. « Pour commencer, l'acte en lui-même n'a quasiment pas changé depuis que nous utilisons la photo, regrette Raphaël Leclercq. Ensuite, il y a évidemment un fort enjeu de qualité puisque nous évaluons l'état d'une structure. Et il existe encore une variabilité des diagnostics d'un inspecteur à l'autre qu'il faut absolument que nous réduisions. C'est en effet la note donnée par les inspecteurs qui détermine la durée, et donc le montant, des contrats de maintenance qui s'étalent entre 5 et 10 ans et s'élèvent à plusieurs dizaines de millions d'euros. »

Computervision, deep learning et machine learning

Pour ce projet, Socotec exploite une base de données groupe et les bases de la Sanef, ainsi que plus de 5000 inspections avec photos et notes associées. « Cela représente près de 150 000 images, soit un volume dix fois plus important que la plus grande base d'images publiques », insiste Raphaël Leclercq. Lorsque les inspecteurs identifient un défaut, ils le prennent en photo avec leur tablette et ils le caractérisent avec un indice de gravité de la situation et un indice caractérisant l'action corrective. Ils ajoutent certaines précisions spécifiques comme la mesure de l'ouverture pour une fissure, par exemple. Socotec a développé avec le CEA List un algorithme de computervision en deep learning pour analyser ces images. L'IA est entrainée avec des données Socotec et Sanef et de la data publique, sur le supercalculateur du CEA List. Une fois un grand nombre de défauts identifiés et caractérisés, un autre algorithme maison, de machine learning classique cette fois, propose des actions à réaliser.

« En un mot, le projet Aurelia, lui, c'est un Shazam pour les chantiers », s'amuse Raphaël Leclercq. La solution doit identifier les sources des nuisances sonores causées par les travaux. Certains chantiers, comme le Grand Paris, sont équipés de sonomètres qui mesurent celles-ci, et si cela pose problème, le chef de chantier essaie en premier lieu de trouver l'équipement responsable. « Avant, c'était le rôle de techniciens avec une expertise très particulière, les 'oreilles d'or'. Aujourd'hui, c'est le premier niveau d'usage du projet Aurelia, explique le directeur data de Socotec. Mais, à moyen terme, cela pourra aussi servir au responsable QHSE (qualité, hygiène, sécurité, environnement, NDLR). » Pas d'IA d'analyse sonore pour Aurelia. Comme le projet Sofia, ce dernier s'appuie sur de la computervision. Sauf que les images analysées sont cette fois des spectrogrammes réalisés à partir des enregistrements sonores de chantier.

Une IA qui fait du bruit

Ensuite, un réseau de neurones permet de les classifier et de les comparer à une base sonore existante. « La machine source du bruit est identifiée en temps réel par du deep learning supervisé, entraîné avec 3000 enregistrements audio, poursuit Raphaël Leclercq. Mais il n'existe pas de base de données de bruits de chantier. Ce sont tout simplement nos équipes qui ont enregistré les sons de référence des équipements sur le terrain. En combinant spectrogrammes et expertise des acousticiens, l'algorithme a appris, par exemple, à discriminer une machine à impact d'un équipement émettant un bruit rémanent. » Pour l'instant, l'IA classifie et identifie en temps réel la source, mais ne donne pas encore de préconisation d'actions correctives. Raphaël Leclercq a déjà tiré quelques leçons de ces deux premiers projets. Il veut ainsi désormais tester ses algorithmes avant la fin des projets. Au bout de 6 mois plutôt que deux ans, par exemple, afin de disposer de premiers retours d'usage et d'adapter les algorithmes au fur et à mesure.

Une indispensable porosité entre IT et métiers...

Socotec emploie 8000 personnes en France dont 5000 ingénieurs, avec un cursus moyen élevé. Un paramètre important dans cette stratégie data et IA de l'entreprise. « La forte expertise intrinsèque de nos métiers place forcément le centre de gravité de l'IA près de ceux-ci, le directeur data de l'entreprise. Il est plus complexe pour un data scientist de s'occuper de la vérification de la stabilité d'un pont que du bon emplacement d'une bannière de publicité web. »

« Même si vous placez dans une même équipe un jeune ingénieur tech et un expert en génie civil, ils ne vont pas se comprendre, poursuit-il. La réponse se matérialise d'abord sous la forme du data et IA hub, interface entre le SI et l'opérationnel, mais aussi dans la sélection de profils que nous qualifions de AI+X. Le X signifiant expert métier. Des personnes avec une double culture, des traits d'union entre les deux mondes. » Le directeur data de Socotec mise beaucoup sur ce type de compétences, même si elles restent difficiles à trouver. « Mais l'IA est déjà entrée dans le programme d'enseignement de la physique, comme à l'ENS Saclay », rappelle-t-il. Il est d'ailleurs lui-même professeur d'IA dans l'établissement. Et ce sera bientôt le cas dans le génie civil. Sans compter que de nombreux employés des métiers ont envie de se reconvertir. Un membre de l'équipe data et IA vient, par exemple, du projet Iter. Socotec déploie des programmes internes de reconversion à l'IA et réfléchit à une data school sur l'exemple de celle créée chez Mazars.

... Jusqu'au coeur des algorithmes

La réussite du hub passe par une extrême porosité avec le reste de l'entreprise, selon Raphaël Leclercq. Or, cette proximité s'infiltre jusqu'au coeur de l'IA proprement dite. Dans le choix et la typologie des algorithmes. « Certaines technologies permettent d'hybrider ces derniers avec des modèles physiques pour de la simulation de structure, par exemple, poursuit le directeur data. Dans ce cas, il s'agit davantage de métamodèles et de réseaux de neurones. » Pour Raphaël Leclercq, cela démontre encore davantage que rien n'est plus important que d'acculturer les équipes à l'IA. « Justement parce qu'elle est intangible, mais qu'en revanche, rien n'est plus concret que construire un pont ! »