Google ouvre en préversion sa plateforme Document AI, également appelée DocAI, conçue pour appliquer l’intelligence artificielle et l'apprentissage machine au traitement de documents à grande échelle. L’automatisation de ces processus se pilote à partir d’une console unifiée. DocAI prend en charge la validation automatique des documents, notamment sur les aspects de conformité. Elle permet d’extraire des textes non structurés des informations structurées dont les utilisateurs métiers pourront se servir. Dans le domaine du CRM, la plateforme peut aider à identifier les attentes des clients pour mettre en place des mesures d’amélioration de la satisfaction et optimiser la valeur tirée de cette relation client. 

Dans un billet, Google explique que DocAI donne accès à des outils d’analyse de texte, ainsi qu’à des applications métiers comme Procurement DocAI (capture automatisée des données sur les approvisionnements) ou encore verticales comme Lending DocAI (pour le suivi des prêts immobiliers), à travers une API unifiée qui met en oeuvre une solution de gestion de document de bout en bout. L’utilisateur pourra personnaliser ses workflows de traitement. L’extraction de données repose sur des analyseurs de texte (parser) qui s’appuient sur la taxonomie prédéfinie de Google Cloud. Elle peut donc s’utiliser sans devoir cartographier les données au préalable ni apprentissage complémentaire, assure Google en citant un utilisateur de la plateforme, la fintech belge Unifiedpost, qui aurait amélioré de 250% la précision de sa capture de données et réduit de 60% ses coût de traitement du cycle procure-to-pay (de l’achat au paiement).

Un modèle de traitement pour chaque type de document 

Les différents « processeurs » de documents utilisés sont regroupés dans un tableau de bord sur DocAI. (Crédit : Google)

La prise en main démarre avec la création du modèle de traitement des documents, que Google appelle « document processor ». DocAI en fournit déjà pour les cas d’usage les plus courants (factures, bons de commandes…) ou spécifiques à certains domaines. Chacun d’eux peut être testé sur des échantillons de documents pour vérifier que l’extraction de données - dates, numéro de facture, nom du fournisseur… - se fait bien, et l’ajuster.

L'ensemble des modèles de traitement disponibles peuvent être consultés sur un tableau de bord. Google propose plusieurs analyseurs pour l’OCR, l’analyse de formulaire ou la division de documents, ainsi que des parsers spécialisés pour les factures et les tickets de caisse ou reçus, notamment. Le fournisseur de services cloud dit travailler à l’ajout d’autres parsers adaptés à différents secteurs d’activité.