- AWS s'équipe de puces Cerebras. En janvier dernier on apprenait qu'OpenAI avait signé un contrat avec le concepteur de puces IA d'un montant de 10 Md$. Cette fois c'est au tour d'AWS de conclure un partenariat pluriannuel avec la start-up : le fournisseur cloud prévoit de déployer dans ses datacenters des systèmes d'inférence CS-3 couplés à ses puces Trainium et de l'interface réseau EFA (elastic fabric adapter)qui seront proposés via son service Bedrock. « Grâce à AWS Trainium, optimisé pour le pré-remplissage, et à Cerebras CS-3 pour le décodage, ce système intégré innovant offrira des performances et une vitesse inégalées pour l'inférence IA », explique Cerebras. Et son CEO et fondateur, Andrew Feldman, d'avancer : « Notre partenariat avec AWS pour développer une solution d'inférence décentralisée permettra d'offrir la solution d'inférence la plus rapide à une clientèle internationale. »
- Sesterce en redressement judiciaire. Dans un article de l’Informé, on apprend que le nécloud provider marseillais Sesterce a été placé en redressement judiciaire depuis le 5 février dernier. Nos confrères évoquent notamment un contentieux avec Mistral AI qui n’aurait pas payé des factures pour un montant de plus de 2,2 millions d’euros. A l’occasion du Sommet sur l’IA à Paris en 2025, le fournisseur de GPU as a service avait présenté un plan pour déployer 1,2 million de GPU dans plusieurs datacenters en prévoyant une premier investissement de 450 M€.
- Le changement de facturation de Google Antigravity agace. La plateforme agentique de développement ne fait plus que des heureux. En cause : un changement du mode de facturation qui ne passe pas. Le forum AI for Developers du fournisseur regorge de plaintes d'abonnés à AI Pro (20 $ HT par mois) qui promettait un quota élevé et généreux de crédits à dépenser sur cette plateforme, renouvelé toutes les cinq heures jusqu'à ce qu'une limite hebdomadaire soit atteinte. Or sur Reddit, un développeur a par exemple indiqué qu'avant janvier il pouvait utiliser plus de 300 millions de tokens d'entrée et 1 à 2 millions en sortie par semaine pour les modèles Gemini Pro, mais que désormais il a atteint ses limites hebdomadaires avec moins de 9 millions de jetons d'entrée et 200 000 jetons de sortie. D'autres ont vu leur rechargement de crédits passer de 5h à une semaine. Les seules options pour eux sont d'acquérir des crédits supplémentaires (25$ HT) ou de migrer sur l'offre Ultra (250 $ HT par mois). Notre confrère The Register qui a rapporté l'information a demandé à Google une clarification, sans réponse à ce stade.