Vince Kellen est conscient des limites bien documentées de ChatGPT, DALL-E et autres technologies d'IA générative - les réponses fournies peuvent être fausses, les images générées peuvent manquer d'intégrité et les résultats peuvent être biaisés - mais il va de l'avant malgré tout. Le directeur informatique de l'université de Californie à San Diego (UCSD) explique que les employés de son organisation utilisent déjà ChatGPT pour écrire du code et des descriptions de poste. Le ChatGPT d'OpenAI, qui génère du texte, ainsi que son cousin DALL-E, qui génère des images, sont les représentants les plus emblématiques de l'IA générative, des outils reposant sur de grands modèles de langage (ou LLM pour Large Language Model). Ces modèles répondent à des demandes écrites en générant une variété de réponses allant de documents textuels à des codes de programmation en passant par des images.
Vince Kellen considère le code généré par ChatGPT comme un outil d'amélioration de la productivité, de la même manière que les compilateurs ont amélioré la productivité par rapport à l'assembleur. « Quelque chose qui produit des bibliothèques et des codes applicatifs n'est pas si différent d'une recherche sur GitHub, observe-t-il. Nous l'utilisons également pour rédiger des descriptions de postes qui tiennent compte de notre contenu et de nos formats. Sur cette base, nous pouvons très rapidement passer à l'édition, à la recherche d'erreurs et d'affabulations. » Si la technologie en est encore à ses débuts, pour certaines applications d'entreprise, comme celles axées sur le contenu et les workflows, son influence se fait déjà sentir. Même s'il faut procéder avec prudence.
Prête pour les bonnes applications
L'IA générative est prête à être utilisée pour le codage, les workflows administratifs, l'affinage des données et les cas d'utilisation simples tels que le pré-remplissage de formulaires, explique de son côté Oliver Wittmaier, DSI et responsable des produits chez DB SYSTEL GmbH, filiale à 100 % de DB AG et prestataire IT de toutes les entreprises du groupe. Et dans l'industrie du transport, dit-il, « l'IA peut avoir un impact direct ou indirect sur l'optimisation des chargements - évitant des déplacements inutiles -, le pilotage du transport et la gestion de celui-ci ».
La génération de contenu est également un domaine qui intéresse particulièrement Michal Cenkl, directeur de l'innovation et des expérimentations chez Mitre Corp. « Si je m'intéresse à un résumé contextuel et à son raffinement par le biais d'un dialogue, c'est précisément ce que ces grands modèles de langage permettent de faire », explique-t-il. Actuellement, son équipe étudie deux cas d'utilisation dans les domaines de la connaissance et de l'expertise. « Dans le premier cas, il s'agit d'écrire un courriel à l'un de nos commanditaires, qui résume le travail que nous avons effectué et qui est pertinent pour lui - en tenant compte du contexte des communications que nous avons déjà eues avec lui. L'outil s'avère alors incroyablement puissant », détaille Michal Cenkl.
Améliorer les images présentées aux clients
Le second cas d'usage concerne la dotation en personnel des projets. Normalement, Michal Cenkl examine les CV et effectue des recherches sur la base de tags de compétences pour trouver les bonnes personnes pour un projet. L'IA générative peut faciliter cette tâche. « Par exemple, je pourrais demander : "Que peut faire Michael sur ce projet ?", en me basant sur ce qu'il fait actuellement, et obtenir un résumé de ce qu'il pourrait faire sans que j'aie à le construire à partir d'un CV », détaille le responsable de Mitre.
Le détaillant de voitures d'occasion CarMax utilise, de son côté, l'IA générative depuis plus d'un an, en s'appuyant sur les API d'OpenAI pour consolider le texte des commentaires de ses clients et en faire des résumés plus faciles à gérer et à lire. Shamim Mohammad, le directeur informatique, explique que son équipe a depuis étendu l'utilisation de cette technologie à d'autres domaines. L'une des applications a été conçue comme un moyen d'améliorer l'expérience clients. L'IA optimise les images de chaque véhicule que l'entreprise ajoute à son inventaire (soit entre 50 000 et 60 000 unités). « Nous rendons chaque image aussi réaliste que possible sans en perdre la validité », précise le DSI. Par exemple, les data scientists de l'entreprise ont créé un modèle de "balayeuse numérique" qui remplace la photo d'une voiture posée sur un sol sale par une image montrant la voiture dans un environnement plus favorable. « Il s'agit toujours de la même voiture, mais elle est plus attractive et l'expérience du client s'en trouve améliorée. »
Shamim Mohammad, DSI du spécialiste des voitures d'occasion CarMax. (Crédit : D.R.)
Dans le même esprit, Nike a utilisé l'IA générative pour générer des images de prototypes de produits, explique Rowan Curran, analyste chez Forrester. « Vous pouvez utiliser un modeleur texte-3D, tester le prototype dans l'espace 3D et obtenir une sensation beaucoup plus viscérale de ce à quoi le produit ressemblera dans le monde réel, le tout avec très peu d'efforts », explique-t-il.
Codes prêts à l'emploi : des résultats encourageants
La création de codes et l'amélioration de l'expérience client sont les principaux domaines dont les entreprises peuvent tirer parti dès aujourd'hui grâce à l'IA générative, et ils présentent le plus grand potentiel de rentabilité en termes de gains d'efficacité, selon Shamim Mohammad, le DSI de CarMax.
Gary Jeter, vice-président exécutif et DSI de TruStone Financial Credit Union, un établissement bancaire américain, explique que ce sont des domaines que ses développeurs ont également explorés avec l'implémentation par GitHub du Codex d'OpenAI. Et de tirer un bilan positif de l'utilisation de l'IA générative pour la production de codes. Pour Michal Cenkl (Mitre), les modèles d'IA générative fonctionnent même mieux sur le codage qu'avec le langage humain, car les langages de programmation sont plus structurés. « L'IA générative est capable d'extraire cette structure, et c'est pour cela que les résultats sont convaincants », explique-t-il.
Nettoyer automatiquement les données non structurées ?
De son côté, CarMax est encore en test sur l'outil Copilot de GitHub, où Shamim Mohammad imagine dans certains cas générer jusqu'à 40 % du code venant de ses équipes. « Les choses évoluent rapidement. Mais il faut s'assurer qu'il n'y a pas de violation des droits d'auteur, de faux contenu ou de logiciels malveillants intégrés si on utilise l'IA générative pour créer des logiciels. Il n'est pas possible de pousser ce code en production sans contrôle », prévient le DSI.
Selon Rowan Curran, de Forrester, d'autres domaines sont mûrs pour les applications d'entreprise, notamment la création de textes d'images et de dessins marketing, ainsi que la création de synthèses plus convaincantes de données existantes afin que les gens puissent les utiliser plus efficacement. « Certains utilisent même ces grands modèles de langage pour nettoyer les données non structurées », précise l'analyste. Par ailleurs, au cours de l'année à venir, les capacités des IA génératives pourraient commencer à être intégrées dans certains logiciels d'entreprise, allant des logiciels de help desk aux applications Microsoft Office.
Supervision humaine obligatoire
Si la technologie affiche des promesses réelles, les DSI qui la déploient doivent être conscients des problèmes potentiels de propriété intellectuelle au sein des résultats générés, prévient le DSI de CarMax. Les modèles génératifs, tels que DALL-E qui s'entraîne à partir de données provenant d'Internet, ont généré des contenus susceptibles d'enfreindre des droits d'auteur. C'est pourquoi Getty Images a récemment intenté un procès à Stability AI pour son outil de génération d'oeuvres d'art piloté par l'IA, Stable Diffusion.
Michal Cenkl, directeur de l'innovation et des expérimentations chez Mitre Corp. Crédit : D.R.)
La technologie a également systématiquement besoin d'une supervision humaine. « Les systèmes tels que ChatGPT n'ont aucune idée de ce qu'ils créent, et ils sont très doués pour vous convaincre que ce qu'ils disent est exact, même quand ce n'est pas le cas », explique Michal Cenkl. L'IA ne fournit ni assurance - une attribution ou des informations de référence vous permettant de savoir comment elle est parvenue à sa réponse -, ni explication - indiquant pourquoi quelque chose a été écrit de cette manière. « Vous ne savez pas quelle est la base ou quelles parties du jeu de données d'entraînement influencent le modèle. Ce que vous obtenez, c'est une analyse purement basée sur un ensemble de données existantes, une analyse qui peut non seulement inclure des biais, mais aussi des erreurs factuelles », reprend le responsable de l'innovation de Mitre Corp.
Applications sensibles : c'est non
Oliver Wittmaier est optimiste quant au potentiel des IA génératives, mais n'est pas encore convaincu par le déploiement de ce qu'il considère comme une technologie naissante en contact direct avec les clients. À ce stade, juge-t-il, il existe un potentiel à court terme dans l'environnement de la suite bureautique, sur les chatbots de dialogue avec les clients, les fonctions d'assistance et la documentation en général. Mais, en ce qui concerne les domaines touchant à la sécurité du transport, la réponse est un non catégorique. « Nous avons encore beaucoup à apprendre et à améliorer pour pouvoir intégrer l'IA générative dans des domaines aussi sensibles », déclare-t-il.
Gary Jeter a les mêmes préoccupations. Bien que son équipe ait utilisé ChatGPT pour identifier une correction de code et la déployer sur un site web en 30 minutes et qu'il pense que l'IA générative est utile pour rédiger des conditions générales dans les contrats, il reste circonspect face à une technologie qui doit encore faire ses preuves. « Nous n'exposerons aucune IA générative à des parties externes. TruStone ne sera pas à la pointe dans ce domaine », tranche le DSI. Lorsque TruStone commencera à utiliser la technologie sur des applications externes, ajoute-t-il, elle contrôlera les conversations par le biais d'un examen humain et automatisé afin de protéger sa marque et ses clients.
Données d'entreprise, limitation des risques
Car, aujourd'hui, la clé d'un déploiement réussi réside dans la présence d'un être humain capable de vérifier l'exactitude et la conformité du contenu généré, explique Vince Kellen de l'UCSD : « S'assurer que la machine prend la bonne décision devient un point de litige potentiel important. Il faudra attendre un certain temps avant que les organisations ne l'utilisent pour tout ce qui présente un risque élevé, comme les diagnostics médicaux ». Mais l'IA générative fonctionne bien pour générer des résumés d'examen, à condition qu'un humain les supervise. « Cela nous ralentit un peu, mais c'est indispensable ». À terme, ajoute-t-il, « nous trouverons des moyens automatisés de garantir une bonne qualité des réponses fournies. Mais, pour l'instant, il faut un processus de révision pour s'assurer que le contenu généré est exact ».
Vince Kellen, directeur informatique de l'université de Californie à San Diego (UCSD). (Crédit : D.R.)
Un autre risque bien documenté réside dans l'inclusion de biais introduits par les données utilisées pour entraîner les modèles. C'est particulièrement problématique lorsque l'IA générative utilise du contenu provenant d'Internet, comme le fait ChatGPT, mais le risque est plus limité lorsque l'on entraîne le modèle à partir des données privées de l'entreprise que l'on peut examiner pour détecter d'éventuels biais, explique Vince Kellen. « Plus on se rapproche de l'entreprise, qui manipule des catégories de données plus limitées et plus banalisées, plus l'IA générative s'impose », ajoute-t-il. Selon Michal Cenkl, ce qu'il faut comprendre des modèles à langage étendu, c'est que ces machines sont, dans une certaine mesure, des savants. « Elles ne comprennent pas, mais elles sont très douées pour le calcul », observe-t-il.
Évolution des responsabilités et des professions
« La technologie a amélioré certaines choses, mais elle a aussi créé beaucoup de travail supplémentaire pour nous », selon Shamim Mohammad, de CarMax. Pour lui, l'IA générative est d'une nature différente. « Elle est passionnante parce qu'elle va nous débarrasser de certaines tâches que nous n'aimons pas faire et nous rendre plus intelligents. Elle va augmenter l'humain »
Rowan Curran souligne toutefois qu'il ne faut pas s'attendre à ce que l'IA générative remplace complètement un quelconque poste à court terme. « Elle peut réduire le nombre de personnes nécessaires à l'exécution d'une tâche, par exemple dans le développement de contenu, la gestion de l'information sur les produits ou le développement de logiciels. Mais il y aura toujours besoin d'un humain dans la boucle ». Et le DSI de CarMax d'ajouter que même si la technologie peut écrire et résumer, l'intelligence humaine sera toujours nécessaire pour assurer la qualité, contrôler le contenu généré et l'améliorer.
Les étapes pour démarrer
Pour Vince Kellen, malgré les limites actuelles de la technologie, le moment est venu de se familiariser avec elle et de commencer à l'expérimenter. « Les DSI doivent se plonger dans ce puzzle avant de se laisser embobiner par les fournisseurs qui intègrent la technologie dans leurs offres de logiciels d'entreprise. Si vous passez l'année qui vient à tergiverser, vous serez à la traîne. »
Il est important de s'informer et d'aller au-delà du débat public sur le seul ChatGPT afin de comprendre que cette technologie est bien plus complexe qu'une seule application, explique Rowan Curran. Et de commencer ensuite à envisager des cas d'utilisation où l'IA générative pourrait améliorer l'efficacité ou la qualité des processus existants. De premières réflexions qui doivent amener les DSI à évaluer les capacités dont ils auront besoin pour lancer de premières expérimentations. Et s'il est nécessaire de les acquérir auprès d'un fournisseur ou s'il vaut mieux les créer soi-même.
Oliver Wittmaier, DSI et responsable des produits chez DB SYSTEL. (Crédit : D.R.)
À partir de là, les tests doivent permettre d'envisager des cas d'utilisation potentiels. « Un grand nombre de vos systèmes, qu'ils utilisent des données structurées ou non, comportent au moins un élément de langage naturel et d'interface conversationnelle, explique Michal Cenkl (Mitre). Réfléchissez aux données dont vous disposez et aux parties de ces données qui peuvent être enrichies par ces technologies. ». Par exemple, Gary Jeter (TruStone) explique qu'il a généré un modèle de conditions générales et l'a ensuite envoyé à son service de conformité pour montrer comment il pouvait l'utiliser.
Les modèles d'IA générative sont volumineux. Les former à partir de zéro est coûteux. La meilleure façon de commencer est donc d'utiliser l'un des services du cloud, selon Rowan Curran (Forrester). CarMax, par exemple, utilise le service Azure OpenAI de Microsoft avec GPT 3.5. « Les données que nous chargeons nous appartiennent - elles ne sont pas partagées avec d'autres, précise Shamim Mohammad, son DSI. Nous pouvons disposer de quantités massives de données et les traiter très rapidement pour exécuter nos modèles. Si vous avez une petite équipe ou un problème commercial qui pourrait tirer parti de la technologie de l'IA générative, essayez-la. »
Commentaire