Plus de deux ans après une présentation en avant-première, Nvidia a annoncé cette semaine la disponibilité générale de ses microservices Neural Module (Nemo), une plateforme modulaire permettant de créer et de personnaliser des modèles d'IA générique et des agents IA. Les microservices Nemo s'intègrent aux plateformes partenaires pour fournir des fonctionnalités telles que le tuning rapide, le micro-ajustement supervisé et des outils d'extraction des connaissances. Le fournisseur de Santa Clara considère ses microservices NeMo comme les éléments constitutifs qui aident les entreprises à créer des data flywheels, ou des boucles de rétroaction où les données sont collectées à partir d'interactions ou de processus, puis utilisées pour affiner en continu les modèles d'IA, ce qui conduit à de meilleures interactions et de meilleurs traitements. À la base, un data flywheel est un système dans lequel les données propriétaires d'une entreprise proposent à l'IA de fournir des services spécifiques, qu'il s'agisse de gérer le support client, d'optimiser le placement de contenu ou de concevoir du matériel avancé comme des composants. La phase initiale nécessite un effort considérable : collecte des données propriétaires et mise en œuvre de services d'IA. Mais une fois la roue lancée, chaque rotation génère des données plus riches et plus précieuses sur les performances et l'impact de l'IA. Au fil du temps, cela crée un cycle de croissance exponentielle où l'efficacité de l'IA augmente à chaque itération, tandis que la nature exclusive des données exploitées confère un avantage concurrentiel indéniable.
Joey Conway, directeur principal de la division logiciels d'IA générative pour les entreprises chez Nvidia, explique que les data flywheels donnent aux services informatiques des entreprises la possibilité d'intégrer des agents IA en tant que coéquipiers numériques qui exploitent les interactions des utilisateurs et les données générées par l'IA à partir d'inférences afin d'améliorer en permanence les performances des modèles. Le système traite les données issues des interactions, les utilise pour personnaliser le modèle qui alimente un agent IA, évalue le modèle pour s'assurer qu'il s'améliore en termes de compétences, puis déploie ce modèle mis à jour avec des garde-fous pour le maintenir centré sur le sujet, et améliore la récupération des informations afin de maximiser la précision. « Nous pensons que chaque agent [IA] aura besoin d'un data flywheel », a souligné M. Conway lors d'une conférence de presse virtuelle mardi dernier. « Le data flywheel est le moyen qui nous permet de passer des données d'entreprise (telles que les données d'inférence, la veille économique et les commentaires des utilisateurs) à l'alimentation et à l'amélioration de l'agent afin qu'il acquière de nouvelles capacités et compétences et apprenne de ses expériences. »
Les microservices Nemo mis à disposition mercredi comprennent les éléments suivants :
- Nemo Data Curator pour collecter, classer et dédupliquer les données d'entreprise.
- Nemo Customizer pour le fine tuning. Ce microservice utilise des techniques post-formation telles que le réglage fin supervisé et l'adoption de rangs faibles.
- Nemo Evaluator pour évaluer les modèles et les workflows d'IA sur la base de benchmarks personnalisés et sectoriels.
- Nemo Guardrails pour améliorer la protection de la conformité grâce à des mesures de sécurité et de sûreté alignées sur les politiques et les directives de l'entreprise.
- Nemo Retriever pour créer des pipelines multimodaux d'extraction, de reclassement et d'intégration qui améliorent la précision des réponses.
Des agents prêts à l'emploi
Conway a souligné que ces microservices sont en passe d'être disponible pour tous, alors que les entreprises commencent à mettre en place des systèmes multi-agents à grande échelle, avec des centaines d'agents spécialisés assistant les employés humains dans presque toutes les fonctions de leur travail. « Cet impact à l'échelle de l'entreprise positionne les agents IA comme une opportunité d'un milliard de milliards de dollars, avec des applications allant de la détection automatisée des fraudes à l'assistance à l'achat, en passant par la maintenance prédictive des machines et la révision de documents. Cela souligne également le rôle essentiel que jouent les data flywheels dans la transformation des données en informations exploitables », a écrit M. Conway dans un article de blog publié plus tôt dans la journée.
Il a également détaillé la manière dont les partenaires de Nvidia exploitent les microservices Nemo dans leurs plateformes d'agents IA. AT&T, par exemple, utilise l'IA agentielle pour soutenir ses centres d'appels. En collaboration avec Arize et Quantiphi, l'opérateur a mis au point un agent IA qui exploite les microservices NeMo pour traiter sa base de connaissances de près de 10 000 documents, qui est actualisée chaque semaine. M. Conway a souligné que les microservices NeMo ont contribué à améliorer la précision de l'agent de 40 %, ce qui a également réduit la charge informatique. Blackrock utilise quant à lui les microservices Nemo pour les capacités d'IA agentielle de sa plateforme technologique Aladdin, unifiant ainsi le processus de gestion des investissements de l'entreprise grâce à un langage de données commun. L'équipe Outshift de Cisco, en collaboration avec son partenaire Galileo, utilise également les microservices Nemo pour un assistant de codage, ce qui a permis de réduire de 40 % les erreurs de sélection d'outils et de multiplier par 10 la vitesse de réponse. M. Conway a ajouté que les microservices Nemo prennent en charge des modèles ouverts, notamment Llama, la famille de petits modèles linguistiques Microsoft Phi, Google Gemma, Mistral et Llama Nemotron Ultra. Meta propose des connecteurs pour Llamastack, et des fournisseurs de logiciels avec IA, notamment Cloudera, Datadog, Dataiku, DataRobot, DataStax, SuperAnnotate et Weights & Biases, ont intégré les microservices Nemo à leurs plateformes.
Commentaire