Vingt ans de cloud, le mail toujours roi
Malgré deux décennies de transformation numérique, la façon dont les organisations gèrent leurs documents n'a pas fondamentalement évolué. « Le mail reste le vecteur principal avec lequel on interagit avec ses données, on les échange, on pilote des processus de validation. On est à peu près au même constat qu'il y a 20 ans », constate Guillaume Brault.
En revanche, les volumes, eux, ont explosé. Selon diverses analyses, les données documentaires - dites non structurées - représentent 90% de la propriété intellectuelle des entreprises, avec un facteur de multiplication par dix sur vingt ans. La loi de Moore appliquée à l'information d'entreprise, en somme. Ces données non structurées s'opposent aux données structurées, celles que l'on retrouve dans les CRM, ERP et bases de données métier, relativement simples à gouverner car liées à un outil. Un fichier, lui, peut graviter entre une centaine d'applications, transiter entre collaborateurs, migrer de poste en poste. « C'est là le vrai chantier, glisse-t-il : gouverner ce qui échappe par nature à tout contrôle. »
L'IA comme révélateur du chaos, non comme remède
Face à cette masse d'informations non gouvernées, la tentation est grande de déployer un agent conversationnel capable d'interroger l'ensemble du fonds documentaire en langage naturel. Une forme de « rustine », selon lui, qui ne règle rien en profondeur. Et dont les effets pervers peuvent être sévères.
Il en donne un exemple révélateur : le fait de retrouver, via une simple requête en langage naturel, la fiche de salaire du dirigeant d'une grande organisation. Non par une faille de sécurité technique, mais parce que le document était simplement mal rangé dans un dossier insuffisamment protégé. « Le principal vecteur de protection de la donnée documentaire, ce ne sont pas les outils de sécurité. C'est ce que j'appelle la protection par l'ignorance : si je ne sais pas qu'une information existe, je ne vais pas la chercher », explique-t-il.
Or, en indexant l'ensemble des silos dans un métasystème d'interrogations, on lève précisément ce voile de l'ignorance. Fiches de paie, projets de fusion-acquisition, clauses contractuelles confidentielles : tout remonte à la surface, indifféremment, puisque les modèles de langage sont incapables de distinguer le menu de la cantine d'un document hautement stratégique. L'IA ne fait alors que révéler, et amplifier, un problème de fond déjà existant. Le principe « garbage in, garbage out » s'applique ici avec acuité : si la qualité de l'information source n'est pas maîtrisée, aucune intelligence artificielle ne pourra en garantir la pertinence, ni la sécurité en sortie.
Classifier pour gouverner : le retour du bon vieux tampon confidentiel
La réponse passe par la métadonnée et la classification automatisée. « On en revient à des concepts vieux de 50 ans : je tamponne le document. C'est le retour du bon vieux tampon confidentiel, mais désormais de manière automatisée, », comme le résume Guillaume Brault. L'IA intervient alors non pour remplacer la gouvernance, mais pour l'outiller à une échelle qu'aucun humain ne pourrait atteindre manuellement.
Cette approche conditionne également la question de la souveraineté des données. Avant même d'évoquer les réglementations ou les législations extraterritoriales comme le Cloud Act américain, il faut savoir ce que l'on confie à des tiers. Une organisation qui ne distingue pas ses documents sensibles de ses contenus anodins ne peut prétendre maîtriser sa souveraineté. C’est là la raison d’être du principe du « kill switch » : la capacité, à tout moment, de rendre un prestataire aveugle aux données qu'on lui confie, grâce à des mécanismes de chiffrement dont l'entreprise conserve seule les clés. « Si l'entreprise veut retirer la clé, l'éditeur devient totalement aveugle aux contenus », précise-t-il.
L'IA en appoint, pas en pilote : ce que veulent vraiment les métiers
Reste la question de l'autonomie des agents IA. Sur ce point, il convient de se montrer prudent, confie Guillaume Brault. Si la direction des systèmes d'information mise sur l'automatisation complète des processus documentaires, les métiers, eux, expriment une tout autre attente. Banquiers, assureurs, équipes créatives, tous travaillent avec des processus extrêmement cadrés, où la prévisibilité est non négociable. Un modèle de langage qui, à un moment, choisit le chemin A plutôt que le chemin B, introduit une imprévisibilité incompatible avec les exigences de conformité.
Dès lors, le rôle de l’IA est d’intervenir « par petites touches, à des moments clés » pour, par exemple, analyser une image de chantier, signaler une anomalie, extraire les clauses à risque d'un contrat dans le cadre d'un processus KYC ou suggérer une classification avant validation humaine. L'IA doit se concevoir comme copilote, non comme commandant de bord. Cette approche suppose néanmoins un préalable souvent négligé : la digitalisation des processus. Or de nombreux workflows d'entreprise reposent encore trop souvent sur le mail ou sur des étapes manuelles.
PME ou grands groupes : qui peut vraiment franchir le pas ?
Les entreprises de taille intermédiaire disposent parfois d'un avantage paradoxal : leur patrimoine documentaire n'a pas encore atteint de taille critique. La mise en ordre peut donc s'opérer sans révolution industrielle. Pour les grands groupes, l'approche doit se faire métier par métier. Un département de 100 000 personnes peut ainsi concentrer des millions de documents rien que pour une fonction RH ou juridique.
Enfin, la réflexion sur les coûts d’une approche de structuration du fonds documentaire doit être abordée dans le bon sens. « Le vrai surcoût n'est pas celui de l'IA, mais celui du chaos préexistant » précise-t-il. Additionner les licences de stockage, de bureautique, et autres applications tierces représente déjà des pétaoctets de données et des budgets conséquents, sans gouvernance en retour. Investir dans la structuration du fonds documentaire devient dès lors une question de rationalisation, pas seulement de modernité. L'IA, correctement branchée sur un socle documentaire maîtrisé, n'est plus alors qu'un canal d'accès à une information déjà bien gouvernée. Et donc, sa promesse de valeur devient enfin crédible.
Cet article est issu d'une série de trois entretiens avec Guillaume Brault, Directeur Technique Europe du Sud de Box, réalisés dans le cadre d'un dossier sur l'IA documentaire en entreprise.