Un an après la v9 de VCF, VMware annonce la déclinaison 9.1 de sa solution cloud privé. Packagée autour des composants vSphere, vSAN et NSX, cette dernière itération de VMware Cloud Foundation est décrite comme une plateforme de cloud privé native pour l'IA et Kubernetes, dotée de fonctionnalités de sécurité intégrées et prenant en charge les infrastructures de calcul mixtes sur les plateformes AMD, Intel et Nvidia. Dans un point presse la semaine dernière, Prashanth Shenoy, vice-président du marketing produit de la division VCF de Broadcom (maison-mère de VMware), a expliqué que cette dernière version s’articulait autour de trois axes principaux : aider les clients à faire face à la crise croissante de l’approvisionnement en matériel et à la hausse des coûts de celui-ci, assurer le déploiement rapide d’applications basées sur l’IA, et apporter un environnement entièrement sécurisé grâce à une architecture zero trust. « Tout comme l'IA a été une aubaine pour de nombreuses entreprises, nous assistons à une explosion des menaces liées à l'IA sur le marché », a-t-il déclaré.

La protection IDS/IPS étendue aux workloads IA Kubernetes

Broadcom a indiqué que la version 9.1 de VCF intègre une fonction de répartition de charge virtualisée grâce à Avi Load Balancer et vDefend qui, combinés, éliminent le besoin d’équipements pour les terminaux d’inférence IA et les applications agentiques. Elle comprend aussi une infrastructure multi-instances supportant jusqu'à 500 clusters Kubernetes par superviseur et 5 000 hôtes ESX pour que les entreprises et fournisseurs de services exécutent plusieurs projets IA et gèrant de multiples clients sur une infrastructure partagée mais avec des « limites de sécurité strictes ». Selon la société, la plateforme accélère le déploiement des applications IA en exécutant des charges de travail d'inférence, des applications agentiques, des services conteneurisés et des machines virtuelles traditionnelles sur une seule couche d'infrastructure. « Cela élimine la fragmentation opérationnelle et le coût lié à la gestion de piles distinctes, tout en apportant la rapidité de développement et la gouvernance de plateforme requises par l'IA en production. »

VCF 9.1 instances

La v9.1 de VCF supporte jusqu'à 500 clusters Kubernetes par instance supervisée. (crédit : VMware)

Selon le fournisseur, par rapport aux versions préliminaires, les capacités d'évolutivité et les performances de Kubernetes pour l'IA multiplient par 2,6 la taille des clusters, accélèrent les déploiements de 75 % et réduisent du même ordre la durée des fenêtres de mise à niveau. La sécurité est également renforcée. VCF 9.1 intègre ce que Broadcom décrit comme « une surveillance centralisée et une correction automatisée de l'état souhaité pour les charges de travail et les composants de la pile VCF ». Parmi les fonctionnalités, on trouve la récupération sur site après une attaque par ransomware, l'application continue de la conformité et une « sécurité latérale » zero trust qui, selon l'entreprise, « étend pour la première fois la protection IDS/IPS distribuée aux charges de travail IA de Kubernetes ». Elle promet également des correctifs en direct sans temps d'arrêt dans jusqu'à 80 % des cas d'utilisation.

Une orientation control plane pour des déploiements IA à l'échelle

Sanchit Vir Gogia, analyste en chef chez Greyhound Research, a souligné que ce lancement « ne doit pas être considéré comme une simple mise à jour trimestrielle du produit. Mais plutôt « d'une tentative de Broadcom de faire évoluer VMware vers le haut de la pile, passant d'une infrastructure de virtualisation à une interface de contrôle régulée pour l'IA en production. » Selon lui, cette évolution est perceptible depuis un certain temps. « VCF 9.0 a fourni les fondements d’un cloud privé moderne, articulé autour d’opérations unifiées, de la gestion de parcs et d’une plateforme standardisée pour les charges de travail traditionnelles, modernes et liées à l’IA. La version 9.1 s’appuie sur cette base pour s’attaquer directement à la question la plus difficile, qui n’est pas de savoir si les entreprises peuvent héberger l’IA sur une infrastructure privée, mais si elles peuvent l’exploiter à grande échelle, sous la pression des coûts, avec une gouvernance crédible », selon Sanchit Vit Gogia. « Héberger une IA, est simple, mais c'est une autre histoire de la faire fonctionner correctement. L'accent mis par la version 9.1 sur l'économie de l'inférence, les flux de travail autonomes, la consommation mixte de CPU et de GPU, l'observabilité en exécution, la sécurité latérale, l'extension de parc et les modèles de déploiement souverains ressemble moins à un catalogue de fonctions qu'à une offre orientée control plane. »

Cet analyste souligne également que Broadcom s’efforce de faire de VCF la couche par laquelle les entreprises gèrent les charges de travail d’IA qu’elles ne confient plus à un modèle générique privilégiant le cloud. Selon lui, cette logique stratégique est tout à fait pertinente. « L’inférence en production ne se comporte en rien comme l’entraînement. Elle est continue, sensible à la latence, fréquemment réglementée et très coûteuse lorsqu’elle est exécutée sur une infrastructure inadaptée », fait remarquer Sanchit Vit Gogia. « À mesure que l'inférence prend de l'ampleur, le centre de gravité des décisions en matière d'IA d'entreprise passe de où pouvons-nous l'exécuter le plus rapidement à où pouvons-nous l'exécuter de manière responsable et prévisible. C'est précisément la brèche que Broadcom cherche à exploiter, et c'est la même brèche que le marché dans son ensemble a fini par atteindre depuis près de deux ans. »

Une concurrence déjà bien aiguisée

Le contexte concurrentiel joue également un rôle important ici, ajoute Sanchit Vit Gogia, « car VCF n’arrive pas sur un marché vierge. Il se positionne sur trois piliers distincts. Le premier concerne la modernisation hybride en lien avec VMware, où Nutanix, Azure Local de Microsoft avec la gouvernance Arc, et HPE GreenLake présentent tous des arguments convaincants en faveur de modèles d’exploitation hybrides plus épurés, intégrant d’emblée la préparation à l’IA. » Le deuxième est celui des « plateformes IA hybrides ouvertes, avec Red Hat OpenShift AI comme challenger le plus affirmé pour les clients privilégiant l’ouverture native de Kubernetes et la portabilité à long terme plutôt que la continuité opérationnelle. » Enfin le dernier est celui des infrastructures IA distribuées et souveraines, où AWS Outposts et EKS Anywhere, Google Distributed Cloud, HPE Private Cloud AI et Dell AI Factory avec Nvidia « proposent tous différentes versions d'une solution d'IA privée clé en main ou quasi clé en main, souvent en mettant davantage l'accent sur les accélérateurs. En dehors de ces camps se trouvent OpenStack et Proxmox, qui importent moins en tant que substituts à part entière qu’en tant que soupapes de pression anti-verrouillage pour les clients réagissant aux conditions commerciales. »

« La position unique de VCF ne correspond à aucune de ces options », tranche Sanchit Vit Gogia : « Il s'agit d'une voie évolutive destinée aux environnements fortement dépendants de VMware qui souhaitent gérer l'IA en production sans avoir à tout repenser de fond en comble. C'est un véritable avantage, car la plupart des entreprises ne souhaitent pas créer une infrastructure d'IA à partir de zéro. Elles recherchent plutôt un moyen fiable d'intégrer l'IA dans le modèle opérationnel qu'elles maîtrisent déjà. » Toujours selon l'analyste, la pérennité de cet avantage « dépendra de la mise en œuvre, de la position contractuelle et de la capacité de l’environnement de confiance autour de Broadcom à se rétablir suffisamment pour que les clients s’engagent pleinement. La question la plus épineuse, et celle sur laquelle ils se prononceront, est de savoir si VMware peut tenir ses promesses en matière de performance de la plateforme tout en continuant à faire face au déficit de confiance résultant de sa réorientation commerciale ». Architecture et crédibilité « ne sont pas la même chose », a-t-il déclaré. « Une plateforme plus performante ne rétablit pas automatiquement ce que les décisions en matière de licences, la réduction du nombre de partenaires et les litiges concernant l’accès aux correctifs ont ébranlé. Il s’agit d’une initiative importante sur un marché qui prend désormais très au sérieux l’IA privée. C’est également une initiative qui doit franchir un obstacle plus élevé que ne l’exigerait une version classique, car Broadcom demande à ses clients de faire davantage confiance à VMware, et non moins. »

Un regain d'intérêt pour le cloud privé

De son côté Dave McCarthy, vice-président chargé des programmes et responsable mondial des services cloud et d’infrastructure chez IDC, a déclaré qu’avec VCF 9.1, « Broadcom démontre son engagement continu envers la plateforme, ce qui est une bonne nouvelle pour les clients existants. Cela devrait dissiper toute crainte quant à la possibilité que l’entreprise mette le produit en mode de maintenance ». Il a ajouté que l’entreprise positionne également VCF comme la plateforme de cloud privé de référence pour tous ceux qui souhaitent passer d’environnements informatiques traditionnels ou rapatrier des charges de travail depuis le cloud public. Il a aussi glissé qu’IDC constate un regain d’intérêt pour le cloud privé en raison des préoccupations liées à la sécurité et à la confidentialité dans le domaine de l’IA. En effet, dans ses prévisions mondiales sur le cloud pour 2026 (FutureScape), la société a déclaré que d’ici 2028, pour répondre aux exigences en matière de confidentialité des données et réduire les risques de fuite vers les LLM publics, 40 % des entreprises adopteront des clouds privés leur apportant un meilleur contrôle sur la gouvernance des données pour les charges de travail IA. Et d'ajouter avoir été « agréablement surpris » de voir le stockage objet intégré en tant que service natif de VCF. « Cela sera extrêmement utile pour les entreprises qui ont adopté une approche de conception d'applications cloud native », a-t-il déclaré.

VCF 9.1 NVMe

La fonction améliorée de tiering mémoire NVMe dans VCF 9.1 permet désormais selon VMware de réduire le TCO des serveurs jusqu'à 40 %. (crédit VMWare)

Lorsqu’on lui a demandé dans quelle mesure il était convaincu que VCF 9.1 serait capable de gérer toutes les exigences de l’IA, de réduire les coûts d’infrastructure et de protéger les charges de travail distribuées modernes, comme l’affirme Broadcom, Dave McCarthy a répondu : « Alors que les entreprises cherchent à faire évoluer leurs charges de travail IA, la rentabilité est une priorité absolue. » Des fonctionnalités telles que le tiering mémoire NVMe « peuvent avoir un impact significatif sur les coûts », a-t-il déclaré. « Compte tenu des problèmes actuels liés à la chaîne d'approvisionnement en mémoire, c'est la fonctionnalité qu'il faut au moment opportun. Pour les environnements edge distribués, le provisionnement sans intervention (zero touch provisioning) peut accélérer les déploiements sans nécessiter la présence de personnel technique sur site. » « Les entreprises commencent à comprendre que VCF ne se limite pas à vSphere et vSAN [dont les fonctions de déduplication et compression ont été améliorées] ; il s’agit d’une plateforme de cloud privé complète dotée d’un ensemble de fonctionnalités inégalé », a-t-il souligné. « Les DSI prennent conscience que les architectures hybrides sont là pour durer ; ils cherchent donc à reproduire l’expérience du cloud public au sein de leurs propres centres de données ; c’est exactement ce qu’apporte VCF. »

La sécurité, moteur des enjeux IA

Et Sanchit Vit Gogia d'avancer : « L’architecture de sécurité est le pilier discret de la version 9.1. L’aspect le plus intéressant d’un point de vue stratégique [de la plateforme] n’est pas le vocabulaire de l’IA. C’est l’architecture de sécurité qui la sous-tend. » La coexistence de machines virtuelles, de conteneurs et de charges de travail IA « modifie considérablement la surface d’attaque », a-t-il déclaré. Par exemple, le trafic est-ouest s’intensifie. L’identité passe de charges de travail éphémères à durables. La communication entre pods et machines virtuelles devient une voie d’attaque significative. Les opérations de récupération s’étendent aux poids de modèles, aux embeddings et aux pipelines de données qui n’existaient pas auparavant en tant qu’actifs de premier ordre. « Rien de tout cela ne s’inscrit dans un modèle de sécurité périmétrique, et très peu de ces éléments sont bien pris en charge par des outils complémentaires », a-t-il déclaré.

L'accent mis par la version 9.1 sur la sécurité latérale pour les charges de travail IA de Kubernetes, la récupération après un ransomware dans des environnements isolés, la conformité continue et les correctifs en direct « n'est pas un élément secondaire de l'histoire de l'IA. C'est l'histoire elle-même », a déclaré M. Gogia. « Un plan de contrôle IA qui ne peut pas être corrigé sans interruption, segmenté sans prolifération, récupéré sans être compromis et audité sans intervention manuelle n'est pas un plan de contrôle. C'est un risque. »