Avec ses puces pour serveurs (Xeon Gen5 Emerald Rapids) dopées à l’IA (avec des accélérateurs dédiés), Intel s'affiche comme un acteur incontournable dans la révolution IA qui se profile. Et sur les serveurs avec ses Xeon de cinquième génération intégrant des Accelerator Engines (à la fois des circuits et des instructions dédiées), bientôt épaulés par l’accélérateur Gaudi 3 (attendu en 2024). Ce dernier a été spécialement conçu pour doper les traitements IA (entrainement et inférence) et concurrencer les GPU de Nvidia et AMD . Dans la course à l’IA, on peut en effet citer trois principaux acteurs : Nvidia et ses accélérateurs H100 très utilisés chez des acteurs comme OpenAI avec ChatGPT, AMD qui entend rattraper son retard sur le premier avec ses GPU MI300 (attendu en 2024), et enfin Intel qui bataille depuis plusieurs années sur le front du HPC pour contrer la progression des GPU dans les clusters de calcul intensif. Ces trois fournisseurs historiques sont toutefois challengés par des acteurs spécialisés comme Cerebras, SambaNova, Groq, et même le Cloud TPU v5p de Google.

« L’innovation en matière d’IA est sur le point d’augmenter l’impact de l’économie numérique jusqu’à un tiers du produit intérieur brut mondial », a expliqué Pat Gelsinger, le CEO d’Intel lors d’un point presse organisé à New York, le 14 décembre dernier. « Intel développe des technologies et des solutions qui permettent aux clients d’intégrer de manière transparente et efficace l’IA dans toutes leurs applications, que ce soit dans le cloud ou, de plus en plus, localement à la périphérie, là où les données sont générées et utilisées. » Avec ses puces Xeon Emerald Rapids de 5e génération, le fondeur se positionne sur le marché du calcul hybride avec des capacités de traitement en local (edge ou datacenter) ou déporté (dans le cloud). Selon le fondeur les Xeon Gen5 apportent une augmentation moyenne de 21 % des performances générales du serveur et permettaient des performances moyennes par watt supérieures de 36 %. « Les clients qui suivent un cycle de rafraîchissement typique de cinq ans et qui effectuent une mise à niveau à partir de générations encore plus anciennes peuvent réduire leur coût total de possession jusqu'à 77 % », a expliqué Intel.

Intel a profondément revu ses Xeon avec cette cinquième génération taillée pour l'IA. (Crédit Intel)

AMD mise sur ses GPU et FPGA pour l'IA

Le fondeur a souligné que le Xeon est le seul processeur pour serveur doté d'une accélération IA intégrée capable de fournir une inférence et un réglage jusqu'à 42 % plus élevés sur des modèles pouvant atteindre 20 milliards de paramètres. « Les accélérateurs IA intégrés de Xeon, associés à des logiciels optimisés et à des capacités de télémétrie améliorées, offrent des déploiements plus faciles à gérer et plus efficaces de charges de travail de réseau et de périphérie exigeantes pour les fournisseurs de services de communication, les réseaux de diffusion de contenu et de vastes marchés verticaux, notamment la vente au détail, la santé et l'industrie manufacturière. » Si AMD a commencé à intégrer des NPU – Hawk Point - dans ses puces Ryzen 8040, les processeurs Epyc pour serveur multiplient simplement le nombre de coeurs (jusqu’à 192) et font appel aux GPU Instinct et aux FPGA (Alveo V70 sur base Xiling) pour accélérer les traitements IA.

Lors de son point presse, Intel a mis en avant ses partenaires et clients avec notamment IBM, qui exploitent des Xeon Gen5 pour sa plate-forme WatsonX. Big blue a indiqué que, lors des tests, les puces Xeon de 5e génération ont atteint un débit de requêtes jusqu'à 2,7 fois supérieur sur sa plate-forme watsonx.data par rapport aux processeurs Xeon de génération précédente lors de ses tests. Enfin, Pat Gelsinger a également offert un aperçu de l'accélérateur d'IA Gaudi 3, dont la sortie est programmée l'année prochaine. Reposant sur les travaux de la start-ups Habana Labs acquise en 2019, cet accélérateur est dédié à l'apprentissage en profondeur et les modèles d'IA générative à grande échelle. « Avec la demande croissante de solutions d'IA générative, Intel espère conquérir une plus grande part du marché des accélérateurs en 2024 avec sa suite d'accélérateurs d'IA pilotée par Gaudi », a déclaré le fondeur.