Petit à petit, Google étoffe Chrome de fonctionnalités IA pour améliorer et automatiser les workflow d’entreprise. Le fournisseur s’appuie sur l’assistant Gemini 3 pour cela. Ainsi, la barre latérale du navigateur s’enrichit des capacités multimodales par exemple de Nano Banana pour la génération d’images. Par ailleurs, il intègre plus étroitement Personnal Intelligence présenté au début de l’année pour accéder aux données personnelles de l’utilisateur au sein de Workspace, Photo, search,...
Mais la fonctionnalité phare est Auto Browse, capable de parcourir les sites web, collecter et traiter les informations, et ainsi supprimer la saisie manuelle et les clics répétitifs dans les workflows professionnels. L’initiative n’est pas sans rappeler celle d’OpenAI qui a lancé Operator en janvier dernier. Il se présente comme un agent capable d'effectuer des tâches automatisées de navigation web comme remplir des formulaires ou commander des articles. Google expérimente depuis plusieurs mois sur la navigation autonome à travers le projet Jarvis.
Une navigation plus autonome
Jusqu’ici, les assistants intégrés à Chrome se limitaient à fournir des informations ou à guider la navigation. Avec Auto Browse, l’IA peut désormais exécuter des séquences d’actions complexes à la place de l’utilisateur. Cette fonctionnalité donne la capacité de rechercher des vols ou des hôtels, de comparer plusieurs options sur différentes dates et de trier les résultats selon votre budget. Elle peut également remplir automatiquement des formulaires en ligne fastidieux ou gérer vos documents fiscaux, collecter des devis ou gérer les abonnements sans avoir à cliquer plus d’une fois, et identifier des objets sur une image, rechercher des produits similaires, les ajouter à votre panier et appliquer des codes promotionnels si nécessaire.

Gemini dans Chrome exploite les applications connectées comme Gmail, Calendrier, YouTube, Maps, Google Shopping et Google Flights pour automatiser les tâches. (Crédit: Google)
Une aide pour les métiers
Disponible aux États-Unis pour les abonnés AI Ultra et AI Pro à 20 $ HT/mois, Auto Browse est considéré par les analystes comme une couche de productivité légère, conçue pour simplifier le travail de connaissance et libérer les employés des tâches répétitives. Selon Abhisekh Satapathy, analyste principal chez Avasant, l’inclusion de fonctionnalités de supervision utilisateur est un point fort : Gemini demande une confirmation avant de réaliser certaines actions. De son côté, Pareekh Jain, analyste principal chez Pareekh Consulting, met en avant la simplicité de l’outil face à des workflows complexes. « Il peut gérer des processus multi-étapes, comme le remplissage de formulaires, l’extraction de reçus depuis des portails, l’agrégation de devis fournisseurs sur différents sites ou la mise à jour de CRM via des interfaces SaaS », précise-t-il.
Pour lui, ces agents IA offrent des gains de productivité substantiels, en donnant aux équipes opérationnelles, par exemple en RH ou en finance, de créer des mini-automatisations sans dépendre d’un développeur, « On peut lui demander d’aller sur un portail fournisseur, de télécharger les factures de janvier et de les enregistrer dans un dossier Drive, sans attendre qu’un script soit écrit. » Libérés de ces tâches répétitives, les développeurs peuvent alors se concentrer sur des instructions plus stratégiques et orientées résultats, améliorant l’efficacité globale des workflows.
Pas sans risques
Malgré ces avantages, les analystes mettent en garde, l'outil n’est pas adapté à tous les workflows. Les systèmes d’entreprise incluent des couches d’authentification, des contrôles basés sur les rôles, des logiques conditionnelles et des interfaces personnalisées, autant de domaines où l’outil peut rencontrer des difficultés. Ainsi, Pareekh Jain souligne, « Il repose uniquement sur les interactions dans le navigateur, sans intégration profonde aux API ou aux systèmes internes, et il peut se montrer fragile sur des pages web dynamiques sujettes à des changements du DOM (Document Object Model). »
En pratique, un agent utilise le DOM pour naviguer sur une page, car il représente sa structure et offre la possibilité de localiser les éléments à cliquer. Mais sur des pages dynamiques, le DOM peut changer fréquemment, ce qui complique la tâche de l’IA. Au-delà de la fiabilité et de l’intégration, des risques de sécurité subsistent : gestion des sessions authentifiées, interaction avec des sites externes non fiables ou soumission involontaire d’informations sensibles. Abhisekh Satapathy ajoute, « Dans les environnements régulés, cela peut compliquer audits et contrôles de conformité.

Commentaire