Avec TransferEngine, Perplexity exécute des LLM sur d'anciens GPU
Le fournisseur d'IA, Perplexity a publié en open source un outil nommé TransferEngine qui rend possible l'exécution de très grands LLM sur des GPU Nvidia H100 et H200. Pour cela,...
Le fournisseur d'IA, Perplexity a publié en open source un outil nommé TransferEngine qui rend possible l'exécution de très grands LLM sur des GPU Nvidia H100 et H200. Pour cela,...
A l'occasion du Red Hat Summit à Paris, le fournisseur de solutions open source a donné la parole à ses clients. Amadeus a partagé son expérience de migration vers le cloud. De...
Après une présentation en avril dernier, les TPU de 7ème génération de Google Cloud vont être accessibles dans les prochaines semaines. Ils promettent plus de performances pour...
Alors que la demande d'IA ne cesse de croître, l'augmentation de la production de DRAM et de HBM par Samsung devrait permettre aux hyperscalers et aux datacenters d'entreprise de...
La dernière plateforme Unified Edge de Cisco inclut la mise en réseau, le calcul et le stockage pour les charges de travail d'IA distribuées, sans oublier la sécurité. Le premier...
L'éditeur de ChatGPT a conclu un accord pluriannuel d'un montant total de 38 Md$ avec AWS pour lui fournir de la puissance de calcul incluant l'accès à plusieurs centaines de...
Selon Bloomberg, Intel serait en pourparlers pour acquérir SambaNova. Fondé en 2017, il propose des accélérateurs pour l'IA et pourrait aider le fondeur de Santa Clara à...
Les deux entreprises ont dévoilé la gamme de commutateurs N9100 basés sur l'accélérateur réseau Ethernet Spectrum-X, ainsi que des architectures de référence. Ces offres...
Le fournisseur s'est associé avec plusieurs sociétés comme Booz Allen, Cisco, Mitre, ODC et T-Mobile pour intégrer de l'IA dans la gestion des futurs réseaux mobiles actuels (5G)...
La puce M5 d'Apple offre à son ordinateur portable professionnel le plus abordable des graphismes et un SSD plus rapides.
Pour jeter des passerelles entre les systèmes quantiques et les GPU, Nvidia a annoncé plusieurs évolutions dans ce domaine. Il pousse la plateforme de développement Cuda-Q et...
Le géant californien des semi-conducteurs a officiellement annoncé son retour sur le marché des puces pour serveurs avec les AI200 et AI250. Cette offensive signe l'ambition du...
Avec ses ThinkCentre Neo, le constructeur chinois propose trois form-factors avec pour point commun l'intégration de processeurs AMD Ryzen.
Selon Reuters, l'administration Trump envisage de freiner l'exportation de logiciels vers la Chine y compris ceux intégrés dans des produits ou systèmes. Une décision qui pourrait...
Les composants comme les processeurs et les mémoires ainsi que les différents protocoles d'interconnexion et autres instructions intégrées au hardware agissent sur l'accélération...
Les derniers résultats financiers d'Intel montrent des signes de reprise notamment sur la demande de puces pour PC. Le fondeur a même annoncé un bénéfice ce trimestre. Il reste...
Le laboratoire quantique de Google a présenté Quantum Echoes, le premier algorithme vérifiable et reproductible. Pour cela, il s'est appuyé sur la puce quantique Willow capable de...