A l'occasion de sa conférence Re:Invent 2025 (1-5 décembre, Las Vegas), AWS a renforcé sa gamme de modèles Nova en annonçant Nova 2 Lite, Pro, Sonic et Omni. Le fournisseur en profite par ailleurs pour présenter un outil de personnalisation de ces modèles avec Nova Forge, ainsi que Nova Act pour gérer et déployer des agents IA.

Nova 2 Lite et Pro orientés raisonnement

Ce modèle de raisonnement est taillé pour les charges de travail IA du quotidien et vise les entreprises recherchant un modèle stable à prix contrôlé. Disponible sur Bedrock, le LLM affiche un coût d'entrée de 0,0003 $ par 1000 tokens et 0,0025 $ par 1000 tokens en sortie. Multimodal, il est capable de traiter du texte, des images et des vidéos. Les entreprises peuvent ajuster son niveau de « réflexion » en paramétrant ses capacités (performance, vitesse et coût). « Il est idéal pour les chatbots de service client, le traitement de documents et l'automatisation des processus métier », explique AWS. D'après le fournisseur, Nova 2 Lite se révèle supérieur à Claude Haiku 4.5 dans 13 benchmarks sur 15, à GPT-5 Mini dans 11 sur 17, et à Gemini Flash 2.5 dans 14 sur 18. « Nova 2 Lite démontre des capacités exceptionnelles dans le traitement de documents, l'extraction d'informations à partir de vidéos, la génération de code, la fourniture de réponses précises et fondées, et l'automatisation de workflows agentiels en plusieurs étapes », fait savoir la société.

Siemens se sert de Nova Lite 2 pour la recherche sur sa marketplace. (Crédit AWS)

Pour les entreprises soucieuses de plus de performances, AWS présente en preview Nova 2 Pro. Il s'agit du modèle de raisonnement le plus performant d'Amazon, capable de traiter du texte, des images, des vidéos et de l'audio. AWS l'estime idéal pour les tâches très complexes telles que le codage agentique, la planification à long terme et la résolution de problèmes sophistiqués, où une précision maximale est essentielle. « Le modèle peut également servir de professeur pour la distillation des connaissances, en transférant ses capacités à des modèles élèves plus petits et plus efficaces pour des domaines et des cas d'utilisation spécifiques », explique l'entreprise. D'après ses comparatifs, Nova 2 Pro est équivalent ou supérieur à Claude Sonnet 4.5 dans 10 benchmarks sur 16, à GPT-5.1 dans 8 sur 16, à Gemini 2.5 Pro dans 15 sur 19, et à Gemini 3 Pro Preview dans 8 sur 18. Nova 2 Pro démontre ses atouts dans l'analyse de plusieurs documents, le raisonnement vidéo, le suivi d'instructions complexes, la résolution de problèmes mathématiques avancés et l'exécution de tâches d'ingénierie logicielle et agentiques. Sur le plan tarifaire, le coût pour 1000 tokens en entrée est de 0,00125 $ (pour du texte, de l'audio, de la vidéo) et 0,01 $ pour les tokens de sortie

Sonic pour la voix et Omni pour le multimodal

Orienté synthèse vocale, Nova 2 Sonic unifie compréhension et génération de texte et de parole, ce qui sera utile pour une IA conversationnelle en temps réel par exemple. Multilingue et capable de voix expressives, il dispose selon AWS d'une plus grande précision et d'une fenêtre contextuelle d'un million de tokens pour des interactions soutenues, tout en permettant une transition fluide entre la voix et le texte. « Le modèle traite les tâches de manière asynchrone, permettant aux utilisateurs de poursuivre des conversations naturelles, même en changeant de sujet, tandis que des actions telles que la réservation de vols s'effectuent en arrière-plan », indique le fournisseur. Nova 2 Sonic s'intègre au service de centre d'appel Connect - renforcé depuis l'an dernier aux agents IA -, aux fournisseurs de communications unifiées et ToIP (Vonage, Twilio, AudioCodes), ainsi qu'aux frameworks IA conversationnelle (LiveKit, Pipecat). « Cela le rend idéal pour les applications de service client, les assistants IA et les expériences vocales interactives », assure le groupe.

Enfin, le dernier modèle dévoilé est Nova 2 Omni capable de raisonnement et multimodal en traitant des entrées textuelles, visuelles, vidéo et vocales tout en générant à la fois du texte et des images. Il peut gèrer jusqu'à 750 000 mots, plusieurs heures d'audio, de longues vidéos et des documents de plusieurs centaines de pages, tout en analysant simultanément des catalogues de produits, des témoignages, des vidéothèques... Certaines entreprises pourront être intéressées pour éviter d'avoir à se connecter à plusieurs modèles spécialisés. « Par exemple, les équipes marketing peuvent analyser les détails des produits dans tous les formats afin de générer instantanément des campagnes complètes, comprenant des titres, des textes, des publications sur les réseaux sociaux et des visuels, dans un seul flux de travail », précise AWS. Côté tarif, les coûts pour 1000 tokens en entrée sont de 0,0003 $ et 0,0025 $ pour les tokens de sortie.

Les prix des offres Nova 2 au sein de Bedrock varient selon plusieurs critères. (Crédit AWS)

Nova Forge pour créer des LLM personnalisés

En plus de ces derniers modèles Nova, le fournisseur a annoncé Forge, un service pour que les entreprises créent leurs propres variantes de modèles basés sur Nova. « Ce dont les entreprises ont besoin, c'est d'avoir accès à la fois aux capacités des modèles de pointe et à la possibilité d'intégrer en profondeur leur expertise », explique AWS. Nova Forge leur apporte ainsi une capacité de créer leurs propres variantes optimisées de Nova, combinant leurs données propriétaires avec les capacités de traitement propre à chaque modèle du fournisseur. Seul Nova 2 Lite est supporté dans Forge et accessible à tous les utilisateurs (Nova 2 Pro et Omni étant en accès restreint). Il permet également d'élaborer des modèles plus petits et plus rapides, formés à partir d'exemples générés par l'IA à partir de modèles plus grands grâce à un processus de distillation basée sur des données synthétiques.

Nova Forge offre des capacités de personnalisation des LLM de la famille Nova 2. (Crédit AWS)

Parmi les utilisateurs de Nova Forge on trouve Booking.com, Reddit, Sony... Les premiers retours sont apparemment prometteurs : « Notre collaboration avec Nova Forge nous permet d'améliorer la modération du contenu sur Reddit grâce à un système plus unifié qui donne déjà des résultats impressionnants », a déclaré Chris Slowe, directeur technique de Reddit. « Nous remplaçons plusieurs modèles différents par une solution unique et plus précise qui rend la modération plus efficace. La possibilité de remplacer plusieurs workflows ML spécialisés par une approche cohérente marque un changement dans la manière dont nous mettons en œuvre et développons l'IA sur Reddit. Après avoir constaté ces premiers succès dans nos efforts en matière de sécurité, nous sommes impatients d'explorer comment Nova Forge pourrait nous aider dans d'autres domaines de notre activité. » 

Déployer des agents IA dans des navigateurs avec Nova Act

A noter aussi la disponibilité - mais pas encore en France - de Nova Act en mode as a service pour créer et déployer des agents IA capables d'effectuer des actions dans les navigateurs Web. Avec cette offre, les développeurs sont en mesure de prototyper un agent en quelques minutes grâce à un environnement de test no code utilisant des prompts en langage naturel, affiner cet agent dans des IDE familiers tels que VS Code, puis le déployer sur AWS. « Nova Act offre une fiabilité de 90 % sur les premiers workflows des clients », assure le fournisseur.

Nova Act

Nova Act constitue un moyen rapide et simple de créer et de gérer des flottes d'agents qui automatisent les tâches basées sur un navigateur. (crédit : AWS)