S'immisçant dans de nombreux domaines, les agents IA se développent aussi dans les outils de traduction et vont au-delà du texte en utilisant la voix, l'image et la vidéo pour communiquer en temps réel et avec une grande précision entre les langues. « Il ne s'agit plus seulement de texte brut. Il faut être capable de gérer la multimodalité. Il y a beaucoup plus de données pertinentes à ingérer », a expliqué Mark Lawyer, président de l'IA linguistique chez RWS. La traduction automatique n'est pas une nouveauté. Mais avec les agents de genAI qui parlent et automatisent les actions dans les domaines de la productivité et du service client, les enjeux sont plus importants. Il y a peu de place pour l'erreur, d'autant plus que les agents remplacent les humains pour accomplir le travail. Les agents de traduction de RWS, DeepL et Grammarly analysent les sources d'information, vérifient l'intention, établissent le contexte et fournissent des traductions qui vont au-delà des mots. « La beauté des agents réside dans leur grande souplesse. Ils sont censés être modulaires », a ajouté M. Lawyer.
La capacité de l'IA à traduire l'audio, la vidéo et le texte aide les outils de GenAI à saisir le contexte et les nuances (par exemple, les actions dans une vidéo ou les tonalités spécifiques dans l'audio) et à les intégrer dans la traduction. « Les langues ne se résument pas à une représentation écrite de pensées pures », a rappelé Stefan Mesken, directeur scientifique chez Deepl. « Il y a un contexte, tant culturel que situationnel. Pour bien comprendre cela, il faut être très proche de ses clients, ce qui implique notamment de parler leur langue. » Les traductions tendent désormais à mieux comprendre l'intention réelle de l'utilisateur. Tout comme l'expression, le contexte physique joue un rôle dans la compréhension des nuances. « Une façon d’aborder cette question consiste à créer un agent multilingue… qui peut passer librement d'une langue à l'autre, ce qui peut être utile pour ce type de travail et qui ressemble beaucoup plus à la façon dont les humains interagissent », a poursuivi M. Mesken.
La qualité de la traduction augmentée par l'IA
L'ONU estime qu'il existe 8 324 langues dans le monde. Pour les langues riches en ressources comme l'anglais, les outils de traduction sont généralement bons, mais la qualité de la traduction diminue fortement dans d'autres langues. « Une autre façon de résoudre cet écart de qualité consiste bien sûr à intégrer l'IA linguistique dans l'espace agentique, essentiellement comme une couche d'accessibilité, de la même manière que nous le faisons avec les humains », a expliqué M. Mesken. Historiquement, les entreprises embauchaient des équipes d'assistance multilingues parlant plusieurs langues, externalisaient cette tâche ou constituaient des équipes distinctes pour chaque langue. « Les agents d'IA de traduction sont en train de changer la donne », a fait remarquer Ailian Gan, directeur de la gestion des produits chez Grammarly. La communication multilingue améliore l'expérience client, « tout en facilitant et en rendant plus rentable l'expansion internationale des entreprises », s’est-il félicité.
Deepl a récemment lancé « Deepl agent », un agent d’IA polyvalent doté de capacités de traduction intégrées basées sur une API de traduction prenant en charge 36 langues. L'agent est capable d'établir un contexte multimodal. « En ce qui concerne les médias, les images et les diagrammes en particulier, étant donné qu'une grande partie de ce monde est codée dans des documents riches en fonctionnalités et en médias, nous nous concentrons aussi, bien sûr, sur ce domaine », a encore déclaré M. Mesken. Le fournisseur propose également des services de traduction écrite et vocale en temps réel. Il prend en charge 36 langues et se concentre sur la qualité plutôt que sur la quantité, car la précision est importante. « Pour les langues riches en ressources, on peut obtenir un résultat satisfaisant dans une certaine mesure, puis celui-ci chute brutalement…, ce qui exclut en fait une grande partie de la population de cette technologie », a fait remarquer M. Mesken.
Des modèles d'IA bien entrainés sur des données en anglais
RWS a développé Evolve, un système de traduction d’IA multi-agents qui traduit d'abord le texte. Un deuxième agent vérifie la précision de la traduction en la comparant à des centaines d'avis humains et de données. RWS est présent dans le secteur de la traduction depuis 30 ans et a rassemblé de nombreuses données sur les communications multilingues. « Si la machine ne parvient toujours pas à trouver comment produire une bonne traduction, c'est à ce moment-là qu'elle est transmise à un traducteur qui apporte les modifications nécessaires », a précisé M. Lawyer. Les agents de traduction sont un domaine où la créativité humaine est essentielle pour garantir l'exactitude et la conformité. DeepL travaille avec des experts linguistiques pour garantir l'exactitude et la fluidité. RWS emploie des milliers de linguistes. « Honnêtement, je ne pense pas que les machines prendront le dessus dans ce secteur pendant ma carrière. Il me reste encore quelques années à faire », a tempéré M. Lawyer.
Grammarly, qui s'est réinventé en tant que plateforme d'IA agentique, a lancé toute une série de fonctionnalités multilingues, notamment la possibilité de traduire facilement 19 langues différentes en temps réel dans n'importe quelle zone de texte. « Notre équipe de linguistes analytiques procède à des évaluations de qualité pour chacune des 19 langues que nous prenons en charge, en tenant compte spécifiquement de ce type de nuances », a indiqué M. Gan. Mais il reste beaucoup à faire dans ce domaine, notamment pour aller au-delà des langues dominantes sur Internet. Les modèles d'IA ont été davantage entraînés sur des données en anglais que sur des langues moins courantes. Les données d'entraînement disponibles se font rares en dehors des 25 langues dominantes et la qualité de la traduction diminue. « Le prochain milliard d'internautes se trouvera sur le continent africain, en Asie du Sud-Est et en Inde », a déclaré M. Lawyer.

Commentaire