Comme nombre d'acteurs de la Défense, l'armée allemande s'intéresse de près à l'IA sous toutes ses formes. Mais pour s'attaquer spécifiquement à l'IA générative, sa filiale IT BWI Gmbh a passé un accord-cadre de 4 ans avec la start-up Aleph Alpha, née à Heidelberg en 2019. Celle-ci développe des LLM à destination des entreprises, mais aussi des administrations, et met l'accent sur l'explicabilité des résultats obtenus.

Les deux organisations souhaitent développer de nouveaux modèles d'IA pour l'armée, mais aussi tester des matériels spécifiquement conçus pour cette technologie. Elles ont identifié deux défis majeurs. Pour commencer, l'augmentation permanente de la taille des modèles d'IA nécessite des capacités de calcul de plus en plus importantes, phénomène qui pousse le matériel conventionnel - GPU compris - à ses limites. Ensuite, la plupart des modèles du marché sont préentraînés et les entreprises qui les exploitent n'ont aucun moyen d'accéder à l'architecture de l'IA, aux données ou aux méthodes d'entraînement.

Des superpuces conçues pour l'IA

Pour répondre au premier enjeu, les deux partenaires testent le potentiel de nouveaux types de matériel optimisés pour l'IA tels les systèmes CS-3 de l'Américain Cerebras. Créé en 2015, il a conçu une puce spécifique pour le machine learning, le WSE-3 (wafer scale engine 3). Il la décrit comme la plus grande et la plus rapide du monde (elle mesure 20 x 22 cm, intègre 4000 milliards de transistors, 900 000 coeurs IA, 44 Go de mémoire on-chip). Selon Cerebras, la puissance de calcul pic du WSE-3 atteint 125 pétaflops, contre seulement 4,4 pétaflops pour le récent B200 Blackwell de Nvidia.

La start-up californienne installe ses processeurs spécialisés dans des systèmes complets intégrés, les CS-3 AI et permet d'en interconnecter jusqu'à 2048 au sein de supercalculateurs dédiés à l'IA. Un potentiel impressionnant qui ira certainement cependant de pair avec des coûts, des besoins en alimentation électrique et en refroidissement à l'avenant...

Outre le besoin d'une puissance de calcul hors norme, la Bundeswehr veut répondre à des enjeux de transparence des modèles d'IA. Une question centrale pour Frank Leidenberger, Pdg de BWI GmbH, en particulier si l'IA doit aider les décideurs humains à évaluer les situations et à planifier les opérations de terrain. « Comprendre comment et pourquoi un modèle d'IA propose une décision permet de mieux évaluer les risques et les opportunités, et donc d'en pratiquer une utilisation responsable et éthique », dit-il. BWI GmbH a donc décidé de développer ses propres modèles d'IA avec Aleph Alpha, mais aussi de les entraîner elle-même avant de mettre les applications à la disposition de la Bundeswehr.