Pour acquérir Modular, une société spécialisée dans les plateformes logicielles natives pour l’IA, Qualcomm met 3,9 milliards de dollars sur la table. Selon le fournisseur de San Diego, cette opération lui permettra d’uniformiser les règles du jeu dans le domaine des centres de données en créant « une couche de calcul indépendante du silicium ». Cette acquisition en actions « permet en outre à Qualcomm de fournir une couche de calcul indépendante de la puce sur l’ensemble des terminaux, de la périphérie aux centres de données, améliorant ainsi le rapport performances/watt, augmentant la flexibilité matérielle et élargissant un écosystème ouvert de développeurs afin que les clients puissent déployer l’IA plus efficacement sur des plateformes hétérogènes à l’échelle mondiale », a déclaré la société dans un communiqué.
Qualcomm estime que les entreprises ont besoin de beaucoup plus de flexibilité dans leurs stratégies de centres de données, surtout compte tenu de l’évolution constante du secteur de l’IA aujourd’hui. Lorsque les DSI doivent prendre des décisions concernant leurs datacenters sans savoir à quoi ressemblera le secteur dans deux ans, cela peut s’avérer difficile. Chris Lattner, CEO de Modular, a indiqué sur LinkedIn que cette uniformisation des règles du jeu dans le domaine des centres de données figurait parmi les premiers objectifs clés de l’entreprise. « Dans un monde où l’on trouve une quantité considérable de matériel IA hétérogène et innovant, il y a toujours eu un fossé : les technologies logicielles existantes, fragmentées, n’étaient pas conçues pour s’adapter efficacement à l’ensemble de ce matériel. Ce fossé freine l’innovation et la liberté de choix, et rend le développement fastidieux », a écrit M. Lattner dans son message sur LinkedIn.
« Modular a été fondé il y a quatre ans et demi pour résoudre ce problème », a-t-il écrit. « Nous avons déjà intégré la prise en charge de plusieurs fournisseurs de puces pour centres de données hyperscale, mais nous ne nous arrêtons pas à ce qui a été annoncé publiquement. Nous avons construit une plateforme ouverte et continuons à l’ouvrir davantage. » M. Lattner a ajouté que l’acquisition par Qualcomm « accélérera nos progrès et notre trajectoire » en « couvrant l’edge computing jusqu’au cloud, les CPU, les GPU, les NPU et les ASIC personnalisés, et peut-être plus encore ».
Répond à un véritable casse-tête
Les analystes, bien que sceptiques quant à la probabilité de réussir à ravir une part de marché significative à Nvidia, ont déclaré que Qualcomm s’était concentré sur un véritable casse-tête pour les entreprises aux prises avec les défis liés aux centres de données. Matt Kimball, vice-président et analyste principal chez Moor Insights & Strategy, a souligné : « L’argument selon lequel Modular peut rendre les centres de données rentables est globalement correct. Alors que l’IA d’entreprise prend véritablement de l’ampleur, le terme “hétérogénéité” est presque un euphémisme. Différents accélérateurs sont nécessaires pour différents cas d’utilisation dans divers scénarios de déploiement. » À ce jour, la gestion de l’IA dans cet environnement a constitué un défi pour les entreprises, a-t-il noté. « Et lorsque l’IA d’entreprise prendra son essor, ce défi sera pleinement mis en évidence. » M. Kimball a ajouté que Modular « peut s’avérer extrêmement précieux pour atteindre deux objectifs qui posent problème à la plupart des entreprises : faire abstraction de la complexité et offrir une flexibilité nettement supérieure. Et cela conduirait certainement à des avantages en termes de coût total de possession (TCO). Je pense que l’affirmation concernant les performances par watt peut être difficile à valider dans tous les scénarios de déploiement sans exception, mais j’en comprends l’esprit. »
Yuri Goryunov, directeur informatique du cabinet de conseil Acceligence, a également salué l’initiative de Qualcomm, mais il a souligné que la valeur de cette transaction réside moins dans la technologie que dans les talents. « L’essentiel réside dans ce que Qualcomm a réellement acquis : non pas des puces, mais la couche logicielle, c’est-à-dire l’équipe de Chris Lattner ainsi que Mojo et le moteur MAX. C’est là qu’il faut exercer la pression. Le véritable avantage concurrentiel de Nvidia n’a jamais résidé dans ses GPU », a-t-il déclaré. « Ce sont Cuda et le coût de réécriture qui maintiennent les charges de travail liées à leur matériel. Une couche crédible permettant d’« écrire une seule fois, puis d’exécuter sur CPU/GPU/NPU/ASIC sans réécriture » est précisément ce qui réduit le coût de changement de fournisseur et fait des puces autres que celles de Nvidia un choix plus sûr. » Mais M. Goryunov a ajouté que l’argument de la « démocratisation » des centres de données était également de poids. « Tout ce qui favorise la démocratisation du calcul et un meilleur acheminement des tâches vers la capacité la mieux adaptée apporte une réelle flexibilité à l’écosystème », a-t-il noté. « Si les charges de travail peuvent être associées à la puissance de calcul appropriée au lieu d’être automatiquement attribuées à un seul fournisseur, tout le monde gagne en efficacité en termes de performances par watt et de coût total de possession (TCO), et les clients bénéficient d’un véritable choix. C’est l’aspect de cette question que je trouve le plus convaincant. »
Il reste toutefois des obstacles
Cela dit, rien de tout cela ne sera facile, a-t-il souligné. « Cela change-t-il la donne face à Nvidia ? Dans l’optique générale, oui. Cela ouvre un deuxième front crédible précisément là où Nvidia est le plus solidement ancré. Je m’abstiendrais toutefois de dire que cela renverse la balance du jour au lendemain. Le fossé creusé par Cuda remonte à une décennie et il s’agit là d’une stratégie qui s’inscrira sur plusieurs années », a déclaré M. Goryunov. « Mais l’attaque vise le bon obstacle et l’équipe qu’ils ont rachetée est on ne peut plus sérieuse pour mener ce combat. » Il a toutefois souligné qu’une grande partie de la stratégie de Qualcomm avec cette acquisition repose sur une hypothèse incertaine : celle selon laquelle Nvidia ne ripostera pas en ouvrant ses architectures à divers autres acteurs. Ou, à tout le moins, que Nvidia ne le fera pas assez rapidement. « C’est là l’obstacle à surmonter, à savoir que Nvidia se concentrera sur sa position dominante », a déclaré M. Goryunov.
M. Kimball a ajouté que, d’un point de vue concurrentiel, Qualcomm a divers obstacles à surmonter. « Une partie de cette acquisition vise directement le défi posé par Nvidia », à savoir trouver un moyen de « faciliter le déploiement de puces hétérogènes par les clients sans que les logiciels ne constituent un obstacle ». John Annand, conseiller technique senior chez Info-Tech Research Group, se montre plus sceptique quant à la capacité de Qualcomm à porter un coup sérieux à Nvidia. Ce dernier « détient environ 85 % du marché des puces d’accélération IA », a-t-il souligné. « Certes, ils ne peuvent que reculer, mais cela leur prendra encore un certain temps. Plus important encore, ils ont littéralement passé des décennies à travailler avec des professionnels de l’IA, du ML et des domaines nécessitant une forte puissance de calcul, en les intégrant à leur écosystème logiciel Cuda. Réécrire cette chaîne d’outils nécessitera un changement structurel au sein de la plupart des entreprises, ce qui signifie des années, voire des décennies, pour s’en affranchir. »
« Les entreprises qui pensent avoir atteint l’agnosticisme parce qu’elles utilisent des abstractions de haut niveau comme PyTorch, eh bien, ce sont celles qui s’en sont le plus rapprochées », a-t-il observé. « Mais le simple fait de copier-coller le même code dans AMD Instinct peut entraîner des erreurs de mémoire et de dépendances. C’est comme les migrations de machines virtuelles vers le cloud public il y a dix ans. C’est plus facile, mais on peut toujours se planter. » Néanmoins, M. Annand a déclaré que cet accord, s’il se concrétise, reste une bonne nouvelle pour les entreprises. « Pour les systèmes d'information, cela signifie que les fournisseurs sur lesquels nous comptons actuellement pour fournir l’IA disposent d’un autre élément de base potentiel. Comme l’informatique d’entreprise accède à l’IA via un appel API, le fait que Claude tourne sur Nvidia, AMD ROCm ou Modular n’a aucune incidence opérationnelle pour nous », a-t-il déclaré. « À l’heure actuelle, en raison des accords commerciaux et boursiers, OpenAI et Anthropic ne sont pas près de changer de camp. Mais si votre entreprise recherche des offres plus spécialisées, comme celles de Cohere, ou souhaite développer ses propres modèles et outils à partir de zéro, cette annonce est très encourageante. »
Objectif : développer une seule fois, exécuter partout
Shashi Bellamkonda, directeur principal de la recherche chez Info-Tech Research Group, estime que cette acquisition potentielle, bien qu’elle puisse apporter des avantages, se heurte à de nombreux obstacles pratiques. « Qualcomm poursuit ce que l’on pourrait appeler la “démocratie des modèles” », a-t-il déclaré, soulignant qu’aujourd’hui, les équipes de déploiement IA sont liées à l’accélérateur sur lequel elles ont entraîné leurs modèles, et que déplacer un modèle vers un matériel différent implique une refonte complète, et pas seulement des changements de configuration. « L’argument de Modular, c’est que ce problème disparaîtra : développer une seule fois, exécuter sur CPU, GPU, NPU, quelle que soit l’infrastructure requise », a déclaré M. Bellamkonda. « C’est un objectif crédible. Le hic, c’est que la démocratie et la portabilité ne sont pas la même chose. Qualcomm optimisera avant tout ses propres puces. Tous les fabricants de matériel le font. Les fondations logicielles indépendantes des fournisseurs ont tendance à développer des préférences matérielles dès que leurs acquéreurs ont besoin de différencier leurs puces. »
Flavio Villanustre, RSSI du groupe LexisNexis Risk Solutions, a apporté un point de vue différent. « Je pense qu’il est important de préciser que Modular est à l’origine du langage de programmation Mojo, qui fournit une couche d’abstraction pour les modèles IA, leur permettant de s’exécuter sur différentes architectures matérielles », a-t-il déclaré. « Dans l’approche traditionnelle, si vous codez une pile d’IA en Python ou en C et que vous ciblez une architecture matérielle particulière, telle que x86, un GPU Nvidia, un GPU AMD ou un TPU, vous devrez réécrire une partie importante de ce code pour le faire fonctionner sur une architecture différente. Avec Mojo, vous le codez une seule fois et il fonctionne partout, même sur des systèmes hybrides composés de différentes architectures matérielles. » Et, a-t-il ajouté, « si l’on considère désormais le fait que Qualcomm détient la propriété intellectuelle et les capacités de fabrication sur différentes architectures matérielles, tant pour les CPU que pour les GPU, cette acquisition pourrait apporter un avantage significatif à ses clients. Je vois cela comme un achat par Qualcomm d’une capacité d’abstraction qui lui permet de proposer une offre matérielle diversifiée tout en offrant à ses clients une réutilisation complète du code sur l’ensemble de son portefeuille de CPU, GPU, TPU et NPU. »

Commentaire