Avec Rubin CPX, Nvidia accélère les traitements d'inférence
Nvidia a présenté l'accélérateur Rubin CPX qui combine le GPU Rubin et des CPU sur base Arm Vera. Intégré au sein du système NVL1144 CPX, il cible les tâches d'inférence en IA.
Nvidia a présenté l'accélérateur Rubin CPX qui combine le GPU Rubin et des CPU sur base Arm Vera. Intégré au sein du système NVL1144 CPX, il cible les tâches d'inférence en IA.
Implanté au Mont Valérien dans les Hauts-de-Seine, le supercalculateur dénommé Asgard pour les applications IA de la Défense vient d'entrer en fonction. Installé par HPE et...
Gravé en 7 nm, le prochain accélérateur IA d'Alibaba serait actuellement en phase de test, et marque un tournant vers une fabrication nationale afin de rivaliser avec les GPU...
Les deux fournisseurs souhaitent développer des ressources informatiques hybrides pour exploiter des algorithmes quantiques avancés.
Des algorithmes maison permettront d'optimiser les performances des systèmes Nvidia Spectrum-X utilisés pour connecter des GPU entre plusieurs serveurs et même entre différents...
Une étude montre l'appétence des entreprises pour l'utilisation des services de GPU as a service des NCP pour leurs charges de travail IA. Elles mettent en avant le prix et la...
Mistral AI a publié le 22 juillet des chiffres sur son empreinte environnementale ainsi que des constats et propositions pour améliorer la précision des rapports sur l'impact de...
Le fabricant américain de puces a présenté les évolutions de sa gamme de SSD haute performance. Parmi eux, on retrouve les SSD 9650 supportant PCIe Gen 6 pour adresser les...
Annoncé en avril dernier, le cluster de Huawei taillé pour les workloads d'IA CloudMatrix 384 a été officiellement dévoilé au public ce samedi lors de la World AI Conference à...
Le spécialiste du stockage Sandisk vient de recruter des experts pour élaborer sa stratégie sur la HBF (high bandwith flash). Cette technologie doit compléter la HBM très utilisée...
Plusieurs analystes conseillent aux responsables IT de bien évaluer l'usage des IDE agentiques. En effet, la volatilité des prix, la latence et les problèmes de sécurité doivent...
Le système d'exploitation z/OS 3.2 sera la pièce maîtresse du mainframe z17, lancé en avril dernier, et inclura la prise en charge des dernières technologies d'accélération IA...
Intégrée à LibTPU, la bibliothèque de surveillance TPU fournit des données télémétriques détaillées, des mesures de performances et des outils de débogage pour aider les...
Exploitant des processeurs Intel Xeon 6 P-Cores, la plateforme serveur X14 de Supermicro cible les charges de travail d'IA, HPC et in-memory. C'est le lancement le plus critique...
À la différence des commutateurs Ethernet classiques qui donnent la priorité au débit maximal, la puce réseau pour datacenter Tomahawk Ultra de Broadcom est optimisée pour assurer...
La commercialisation des puces H20 intervient alors que les tensions entre les États-Unis et la Chine s'apaisent. Cette dernière assouplit ses restrictions sur les exportations de...
Le CEO d'Intel, Lip-Bu Tan, a expliqué aux employés lors d'une émission diffusée dans toute l'entreprise, que le fondeur n'était pas dans le Top 10 du secteur, avant d'annoncer...