De plus en plus d’entreprises veulent enrichir les charges de travail IA avec leurs propres données, mais hésitent à le faire dans le cloud pour des questions de sécurité. Pour répondre à cette problématique, AWS a dévoilé lors de son évènement Re:Invent une infrastructure IA entièrement managée : AI Factories.
À l'instar de son offre Outposts existante (et qui n’a pas connu un grand succès) pour les workloads classiques, AI Factories déploie du matériel et des logiciels dédiés directement dans le datacenter du client. Ce dernier peut ainsi exécuter des applications IA et des agents au plus prés des données de l’entreprise. La pile matérielle et logicielle comprend les GPU Nvidia les plus récents (Blackwell B200/B300), les accélérateurs Trainium, un réseau haut débit (Nitro, Elastic Fabric Adapter, UltraClusters) et des services IA tels que SageMaker et Bedrock. A l’occasion de son discours inaugural, Matt Garman, CEO d’AWS a indiqué que AI Factories se présente comme « une région AWS privée ».
Un marché très concurrentiel
Pour les analystes, cette offre répond à un besoin. Elle « vise à résoudre la tension entre la rapidité d’innovation native du cloud et le contrôle souverain », explique Stephen Sopko, analyste chez HyperFrame Research. Il ajoute, « historiquement, ces objectifs étaient contradictoires. Les DSI étaient confrontés à un dilemme intenable : choisir entre la sécurité sur site et les avantages du cloud public en termes de coûts et de vitesse ».
Par ailleurs, AWS n’est pas la seule société à proposer ce type d’offres. Oracle a intégré des GPU Nvidia à son offre Cloud@Customer gérée sur site en mars, tandis que Microsoft l’a fait le mois dernier au sein d’Azure Local. De son côté, Google étoffe progressivement son offre Cloud Distributed avec des fonctionnalités IA notamment l’intégration de Gemini. De même, AI Factories se confronte aux solutions des constructeurs comme Dell, HPE et même Nvidia. Pour Stephen Sopko, AWS bénéficiera d'un avantage concurrentiel grâce à son intégration matérielle et logicielle et à sa maturité opérationnelle. « Le secret réside dans le logiciel, et non dans l'infrastructure », souligne l’analyste. Il alerte néanmoins sur les coûts d’engagement élevés. « L'offre Dedicated Region comparable d'Oracle requiert un engagement de cinq ans avec des dépenses annuelles minimales d'environ un million de dollars. Compte tenu des investissements d'infrastructure qu'AWS doit réaliser pour le déploiement du matériel, du réseau et de la gestion, je m'attends à des engagements pluriannuels similaires. » AWS n’a pas donné de précision sur la durée d’engagement, ni sur le tarif des AI Factories.