La question de la mémoire pour les agents IA est importante dans leur capacité d’apprentissage et de performance. Des chercheurs de l’université Zhejiang et d’Alibaba ont mis au point un framework nommé Memp dotant les agents d’une forme de mémoire procédurale. Cette dernière est celle du savoir-faire, des automatismes (comme par exemple les mouvements dans le sport, nager ou faire du vélo). Au lieu de réapprendre les flux à partir de zéro, avec Memp les agents peuvent stocker, récupérer et mettre à jour leurs expériences passées en temps réel. Pour les développeurs et les architectes, cela se traduit par moins de tokens gaspillés, une exécution plus rapide des tâches et la possibilité d'utiliser des modèles plus petits et moins coûteux sans sacrifier les performances. Cette avancée pourrait avoir un impact sur la construction des pipelines d'IA et des architectures d'agents. « Les agents basés sur des grands modèles de langage (LLM) excellent dans diverses tâches, mais ils souffrent d'une mémoire procédurale fragile conçue manuellement ou enchevêtrée dans des paramètres statiques », ont déclaré les chercheurs dans leur article.
« Notre framework Memp, indépendant des tâches, élève la mémoire procédurale au rang d'objectif d'optimisation principal pour les agents basés sur les LLM », ont-ils ajouté. « En étudiant systématiquement les stratégies de construction, de récupération et de mise à jour de la mémoire, Memp donne aux agents la capacité de distiller, réutiliser et affiner leurs propres expériences passées dans le cadre de tâches diverses et étalées dans le temps. » Selon les chercheurs, les tests sur l'automatisation des tâches courantes et les benchmarks de recherche d'informations ont montré que la mémoire procédurale améliorait considérablement les taux de réussite et l'efficacité des tâches. Au-delà de l'amélioration des performances sur des tâches individuelles, Memp ouvre aussi la voie à un apprentissage continu et une généralisation plus forte, rapprochant les agents d’IA de l'auto-amélioration et de la résilience », ont-ils affirmé.
Des mécanismes particuliers de mise à jour
Ce framework indépendant des tâches traite la mémoire procédurale comme un objectif d'optimisation central. Les chercheurs ont étudié comment différentes stratégies de construction, de récupération et de mise à jour de la mémoire influençaient les performances globales. Au cours de la phase de construction, les agents capturent soit des trajectoires de tâches complètes, soit des directives distillées à partir d'expériences passées. Pour la récupération, des techniques telles que la correspondance par vecteur de requête et par mot-clé sont utilisées pour identifier les connaissances antérieures les plus pertinentes. Là où Memp se distingue vraiment, c’est dans ses mécanismes de mise à jour.
« Contrairement aux mécanismes de mémoire antérieurs ou à l'apprentissage par l'expérience, Memp introduit différentes stratégies de mise à jour de la mémoire procédurale : dans le domaine des agents, la mise à jour de la mémoire est cruciale pour que les agents s'adaptent à des environnements dynamiques », ont expliqué les chercheurs. « En incorporant diverses stratégies telles que l'ajout ordinaire, le filtrage de validation, la réflexion et le rejet dynamique, les agents peuvent gérer efficacement leur base de connaissances. » Grâce à ces méthodes d’actualisation, les agents peuvent absorber d’autres informations, supprimer les données obsolètes et optimiser leurs ressources mémoire. Selon les chercheurs, les agents sont ainsi plus efficaces, améliorent leur prise de décision et renforcent leur capacité d'adaptation à différentes tâches.
Des avantages pour les entreprises
Les analystes affirment que la mémoire procédurale pourrait rendre les agents d’IA plus pratiques à déployer à grande échelle, même pour les entreprises de taille moyenne. En réduisant les besoins en calcul et la nécessité d'une supervision constante, elle promet de réduire à la fois les coûts et la complexité. « La mémoire procédurale excelle dans les processus métiers structurés et en plusieurs étapes, comme le service client, la finance et la logistique, entre autres choses », a déclaré Prabhu Ram, vice-président du groupe de recherche industrielle chez Cybermedia Research. « Son modèle d'intégration modulaire et incrémental apporte aux entreprises la possibilité de mettre à niveau les agents existants sans avoir à procéder à des révisions systémiques perturbatrices. » Il est important de noter que l'article des chercheurs souligne que les connaissances procédurales créées par un modèle plus grand peuvent être distillées dans une banque de mémoire et réutilisées par un modèle plus petit avec un minimum de frais, et au système plus faible d'améliorer considérablement ses performances.
Grâce à ce transfert de mémoire, il est possible d'appliquer rapidement les connaissances acquises par un modèle à un autre, facilitant l’adaptation des agents à d’autres tâches avec une efficacité et une résilience accrues. « Au lieu de consommer la capacité de modèles de fondation coûteux pour chaque requête, les entreprises peuvent effectuer une seule formation et la déployer à plusieurs reprises sur des moteurs plus petits dont le coût est nettement inférieur », a fait valoir Sanchit Vir Gogia, analyste en chef et CEO de Greyhound Research. Cette logique consistant à « se former avec les meilleurs et fonctionner avec les autres » peut se traduire par des économies considérables sur les charges de travail volumineuses, les implications économiques sont donc profondes », a ajouté l’analyste. Les agents d’IA peuvent s'améliorer au fil du temps sans augmenter les coûts unitaires, offrant un retour sur investissement cumulatif plutôt qu'une explosion des dépenses. Les DSI et les directeurs financiers disposent aussi d’une prévisibilité qui leur faisait jusqu'à présent défaut dans la planification financière de l'IA d'entreprise.
Des risques à prendre en compte
Cependant, d'autres alertent sur le fait que cette technologie ne répond qu'à une partie des capacités de mémoire requises pour l'IA d'entreprise. Les agents peuvent déjà enregistrer les actions réussies et celles qui ont échoué, conserver le contexte à court terme des tâches en cours et construire une mémoire à long terme sur plusieurs tâches ou domaines. « La mémoire procédurale ne répond qu'à une partie de ces caractéristiques », a mis en garde Anushree Verma, analyste senior chez Gartner.
« Si cela peut être utile dans les cas où les agents d’IA sont responsables d'une petite partie du processus, un déploiement significatif à grande échelle nécessitera des investissements dans des architectures de mémoire robustes. » M. Gogia ajoute à ces risques la dérive, quand les agents s'appuient sur des routines obsolètes, l'empoisonnement, lorsque des entrées erronées ou malveillantes corrompent la mémoire, et encore l'opacité, lorsque les décisions sont basées sur des étapes mémorisées invisibles.