Fondé en 2023, Eridu est sorti du mode furtif en annonçant un financement de plus de 200 M$ pour développer ses switch optiques pour les réseaux IA. Le tour de table a été mené par Socratic Partners, avec la participation de John Doerr, Hudson River Trading, Capricorn Investment Group et Matter Venture Partners, entre autres. La start-up basée à Saratoga en Californie a été co-créée par Drew Perkins (CEO), qui avait auparavant cofondé Lightera, rachetée par Ciena, ainsi qu'Infinera, rachetée pour 2,3 milliards de dollars par Nokia. Les deux autres co-fondateurs sont Mike Capuano (directeur du développement commercial ou CRO) et Omar Hassen (directeur produit ou CPO). Le nom de la société fait référence l'ancienne ville mésopotamienne considérée comme l'une des plus anciennes de l'histoire.

Concrètement, Eridu développe un hyperswitch Ethernet à radix élevé taillé pour les charges de travail IA, basé sur un Asic propriétaire. Parmi les clients potentiels figurent les hyperscalers, les néoclouds et les opérateurs de clouds locaux. L’entreprise n'a pas divulgué les spécifications du produit ni la date de disponibilité générale. Des détails techniques supplémentaires et des annonces de partenariats sont prévus pour la fin de l'année 2026. Le domaine concurrentiel dans lequel Eridu fait son entrée n'est pas des moindres, puisque l'entreprise vise de grands acteurs comme Broadcom, Cisco, Huawei et Nvidia (qui proposent des switch optiques 800G). L'entreprise affirme que les fournisseurs existants ont apporté des améliorations progressives à la même architecture sous-jacente plutôt que de répondre aux exigences réelles en matière d'échelle de l'infrastructure IA. « Le réseau des centres de données IA doit être repensé de fond en comble, car il est différent du réseau des datacenters cloud », a déclaré M. Perkins. « Chaque fois qu'il y a une nouvelle application, un nouveau besoin, les exigences sont différentes. Des puces aux boîtiers, en passant par le système, les logiciels et l'optique, tout doit être repensé pour un type d'application différent. »

Des exigences différentes du cloud

Les exigences du réseau IA sont différentes de celles des technologies réseau qui ont été développées et déployées pour le cloud. Selon M. Perkins, la différence fondamentale réside dans l'échelle. Un datacenter cloud typique exploite environ 100 000 serveurs, chacun utilisant des dizaines de gigabits par seconde de bande passante. Ceux pour l’IA sont construits autour de millions de GPU, chacun nécessitant des quantités encore plus importantes de bande passante. « Le réseau est resté bloqué au même niveau d'amélioration de fois deux tous les deux ans pendant au moins 30 ans, et certainement 20 ans », a-t-il expliqué. « Le réseau ne suit pas le rythme du calcul, et cet écart ne cesse de se creuser. »

Cet écart n'est pas statique. Selon Promode Nedungadi, le directeur technique d’Eridu, les tendances architecturales et algorithmiques qui sous-tendent l'IA compliquent le problème du réseau au lieu de le simplifier. Des techniques telles que les modèles mixtes d'experts et la désagrégation de l'inférence en étapes distinctes de pré-remplissage et de décodage nécessitent toutes un transfert de données plus important. « Chacune d'entre elles nécessite le transfert d'un plus grand volume de données », a-t-il ajouté. « La quantité de données transférées par token augmente. » Le défi de l'échelle comporte également plusieurs dimensions. M. Perkins en a décrit trois : la mise à l'échelle, qui fait référence à l'interconnexion des GPU au sein d'un seul domaine d’entraînement ; l'extension, qui couvre la structure plus large du cluster ; et ce qu'il a appelé la mise à l'échelle transversale, une exigence que les organismes de normalisation commencent à prendre en compte. « Nous pensons que la mise à l'échelle transversale est également très intéressante », a-t-il poursuivi.

Une puce, un packaging et des logiciels

L'Asic sera un facteur clé de différenciation de l’architecture pour Eridu. « Il ne fait aucun doute que nous développons notre propre puce. C’est le silicium le plus avancé du secteur des réseaux, sans exception, et c'est absolument nécessaire », a affirmé M. Perkins. « Il n’est pas possible d’atteindre une échelle supérieure d'un ordre de grandeur en utilisant une puce disponible dans le commerce. » Eridu a conclu un partenariat avec TSMC pour la technologie de processus et l'intégration de systèmes avancés. Selon M. Perkins, TSMC considère que le goulot d'étranglement du réseau est directement lié à sa propre activité. Le composant devrait bénéficier d'une architecture basée sur des chiplets et d'un packaging avancé.

« Nous pensons qu'il faut se démarquer de la technologie dominante », a déclaré Omar Hassen, directeur produit d’Eridu. « Par exemple, en matière de packaging avancé, il faut tirer parti de tout ce que l'architecture basée sur les chiplets, la conception à partir d'une feuille blanche et le packaging avancé ont à offrir. Nous pensons être sur la bonne voie technologique pour aller au-delà de ce que font les acteurs existants. » Fondamentalement, l'approche d'Eridu consiste à tenter de dépasser les limites architecturales auxquelles sont confrontés les acteurs existants afin d'obtenir une amélioration d'un ordre de grandeur. « Il faut partir d'un point différent, sinon on risque de se heurter à un plafond si l'on utilise la même architecture que tout le monde », a ajouté M. Hassen.