Avec l'IA générative, Thomson Reuters accélère sur le tri des données (1ere partie)

Thomson Reuters a passé des années à construire une plateforme d'IA pour trier d'énormes quantités de données et de documents pour ses clients dans les domaines du droit, du commerce et de la conformité. Mais lorsque l'IA générative est apparue, l'entreprise a été obligée de monter son niveau de jeu.

Au cours des trois dernières décennies, Thomson Reuters s'est appuyé sur l'intelligence artificielle (IA) pour aider ses clients - et ses propres employés - à passer au crible des tonnes de documents numériques afin de découvrir les plus pertinents en fonction de la question à traiter. Mais lorsque l'IA générative (GenAI) a fait irruption sur la scène à la fin de l'année 2022, l'entreprise a été contrainte de repenser sa stratégie afin de conserver son positionnement concurrentiel et de répondre à la demande de ses clients en matière d'informations spécifiques à leur secteur d'activité.

En novembre, Thomson Reuters a dévoilé sa stratégie GenAI et le déploiement de ses produits après l'intégration avec Microsoft Copilot. L'annonce de cette dernière faisait suite à l'acquisition pour 650 M$ du fournisseur de technologie de GenAI Casetext (éditeur de l'assistant CoCounsel dédié à l'information légale). L'agence de presse et société d'édition, qui emploie quelque 25 000 personnes et fournit en particulier des données et informations aux professionnels des secteurs juridique, fiscal et comptable, s'est engagée à investir 100 M$ par an dans de nouveaux outils de GenAI destinés à un usage interne, mais aussi à ses clients.

La solution actuelle de l'entreprise est une plateforme basée sur le cloud et pilotée par API qui exploite l'ensemble du contenu de l'entreprise pour permettre aux employés et clients de développer de nouvelles capacités en IA à l'aide de composants réutilisables. L'entreprise de Toronto a également dû former à nouveau tous ses employés pour qu'ils comprennent comment utiliser au mieux la nouvelle plateforme de GenAI.

Shawn Malhotra, responsable de l'ingénierie chez Thomson Reuters, a dirigé la création d'une IA Factory, vue comme un moyen de créer de nouvelles applications avec un minimum de support technique. La démarche ? Confier à des experts la conception et le déploiement d'outils réexploitables dans plusieurs contextes, pour laisser les non-techniciens expérimenter la technologie en toute sécurité, rendant l'innovation et l'idéation plus rapides et plus inclusives. Grâce à cette plateforme, Thomson Reuters a pu déployer trois solutions basées sur l'IA pour les avocats et d'autres clients au cours des trois derniers mois, et en prévoit d'autres dans un avenir proche.

Shawn Malhotra revient sur la manière dont son entreprise a élaboré sa stratégie en matière d'IA.

A quel problème a été confronté Thomson Reuters avec l'arrivée de la GenAI ?

Shawn Malhotra : Nous avons commencé par écouter nos clients et nous nous sommes rendu compte qu'il était possible d'accélérer la plupart des tâches qui leur posaient problème et auxquelles ils consacraient beaucoup de temps, grâce à ces outils qui s'appuient sur de grands modèles de langage (LLM). En fait, cela a créé un problème secondaire pour nous ; il y avait tellement d'opportunités sur tous ces marchés finaux que nous devions nous interroger sur la manière d'aborder ce chantier au rythme auquel les clients nous le demandaient. Et c'est notre plateforme de GenAI qui nous permet d'innover à la vitesse attendue.

En novembre, nous avons lancé la recherche assistée par l'IA avec Westlaw Precision memo (assistant de recherche sur l'information juridique, NDLR). Auquel se sont ajoutés deux autres produits récemment. Le fait de pouvoir lancer ces solutions à un rythme soutenu est vraiment rendu possible par cette plateforme d'IA, qui permet à nos développeurs d'exploiter rapidement des blocs de base qu'ils peuvent réutiliser dans plusieurs produits.

Lorsque l'IA générative est arrivée, quels profils avez-vous ajouté à votre équipe de Data Science ?

Je ne pense pas que ce soit très différent des autres efforts de développement. Vous avez besoin de développeurs, de concepteurs, de gestionnaires de produits. Vous avez besoin de votre équipe juridique pour vous assurer que ce que vous faites est bien conforme aux attentes de vos clients. En somme, toutes les parties prenantes que vous vous attendiez à avoir. La différence avec l'IA, c'est qu'il s'agit d'une nouveauté pour nous, pour les juristes, les développeurs ou les spécialistes du marketing. D'où l'importance de la formation. Les équipes doivent être en mesure de résoudre les nouveaux problèmes qui émergent.

Si la solution au problème consiste uniquement à recruter davantage d'experts en IA pour répondre aux besoins e vos clients, vous ne serez pas en mesure de proposer de nouveaux produits assez rapidement. Vous devez construire votre équipe de façon évolutive. Pour nous, cela a consisté à nous appuyer sur notre expertise DBI (une interface de programmation, NDLR) et à l'utiliser pour construire les blocs de base, afin de permettre aux experts non-IA de fournir de la valeur à nos clients avec la technologie. C'est la seule façon de faire évoluer les choses.

Lorsque la GenAI est devenue accessible au public à la fin de l'année 2022, en quoi cela a-t-il changé la donne ?

Nous avions expérimenté les versions précédentes des grands modèles de langage [d'OpenAI], ainsi que d'autres modèles basés sur des transformeurs par le passé. Nous avons donc depuis longtemps cette technologie sur nos radars. Ce qui s'est passé en novembre 2022, c'est que la taille et la qualité des modèles de langage ont alors atteint un point d'inflexion, amenant à la résolution de problèmes que nous n'étions pas capables d'aborder auparavant. Nous avions essayé d'utiliser les modèles précédents pour aider un avocat à résumer toute une série d'affaires et à en dégager les faits saillants de manière efficace. Sans succès. Tout d'un coup, les modèles devenaient suffisamment performants pour ce type d'usage. GPT a accéléré quelque chose qui était déjà en marche, et nous avons donc dû réagir rapidement.

Comment avez-vous appliqué l'IA générative en interne grâce à votre acquisition de Casetext et au sein d'outils de recherche assistée par l'IA tels que Westlaw Precision et CoCounsel Core ?

Je commencerai par Westlaw (service de recherche juridique, NDLR). En novembre dernier, nous avons publié un mémo sur la recherche assistée par l'IA. L'un des principaux problèmes auxquels est confronté un avocat, ce sont les recherches juridiques. Cela signifie souvent qu'il faut saisir un texte dans le moteur de recherche de Westlaw afin de trouver des affaires susceptibles de répondre à la question juridique que vous vous posez. Cela nécessite un contenu complet, actualisé et correct afin de s'assurer que la recherche porte sur les bons éléments.

Et en tant qu'avocat, vous devez lire tout ce contenu. Avec un peu de chance, seul le contenu pertinent est apparu, mais il faut quand même le lire. Et vous devez comprendre s'il est réellement pertinent par rapport à votre recherche. C'est la première étape.

Auparavant, nous utilisions l'IA pour faire apparaître les bonnes informations. Cela résolvait le problème de la recherche. Maintenant, avec la GenAI, non seulement Westlaw Precision memo trouve la bonne information, mais il résume maintenant tous les cas qui pourraient être pertinents. Il vous donne les citations dont vous pourriez avoir besoin afin de vérifier que l'information provient d'un contenu fiable. Enfin, il fournit un résumé lisible et compréhensible. Cela permet à nos clients de gagner du temps. Et les aide à fournir un produit de meilleure qualité à leurs propres clients.

CoCouncil a été créé grâce à l'excellent travail de l'équipe de Casetext. Elle a été l'une des premières entreprises au monde à s'associer à OpenAI, avant même la sortie de GPT. Cela leur a donné une longueur d'avance dans la création de ce qu'ils appellent des compétences d'IA, c'est-à-dire des compétences qui aideront un avocat à résumer des documents, poser des questions à partir d'une base de données d'informations et toute une série d'autres compétences. Plutôt que de chercher votre propre contenu, il vous suffit de nous dire ce que vous voulez faire et nous vous faisons remonter le bon contenu à la surface. Cela permettra d'obtenir des réponses assistées par l'IA beaucoup plus rapidement.

Quelles caractéristiques de l'IA générative vous ont surpris ?

Simplement la qualité du résultat. Ce qui ne nous a pas surpris en revanche, c'est que si l'on utilise l'IA générative sans un contenu de première qualité et fiable, des problèmes vont survenir. Mais l'ampleur de ces problèmes n'est plus aussi importante qu'auparavant. Avant les récentes avancées nous avions l'habitude de dire que si l'on prenait ces modèles de langage et qu'on les évaluait, ils auraient pu obtenir un D ou un F. Des résultats assez médiocres. Avec les nouveaux modèles linguistiques que nous avons essayés dans l'espace client sans modification, la note obtenue équivalait à un D ou un C. Il s'agissait donc d'un changement considérable.

Mais ce que nous avons appris, c'est qu'en appliquant des techniques telles que la génération augmentée par récupération (Retrieval Augmented Generation ou RAG), qui nous a permis de combiner notre contenu de très grande qualité à la puissance d'un LLM, la note atteignait le A. Pour nos clients, avoir raison une fois de temps en temps n'est pas acceptable. Ils sont confrontés à des enjeux très importants et doivent savoir que le contenu est fiable, actualisé et complet. Cette approche basée sur le RAG a été un véritable "moment de grâce", et nous avons trouvé une réelle valeur ajoutée pour nos clients.

Sur le même thème

Partenaires

Avec l'IA générative, Thomson Reuters accélère sur le tri des données (1ere partie)

Livres blancs

Commentaire

Suivre toute l'actualité

Newsletter