Anthropic accuse Alibaba d'avoir siphonné les capacités des modèles Claude

Le fournisseur IA estime que la société chinoise a généré plus de 25 000 faux comptes pour copier les capacités des modèles Claude. Les analystes estiment que les éditeurs ont les moyens de mettre en place des mesures de protection contre le scraping.

Après Deepseek, Moonshot et Minimax, c'est au tour du chinois Alibaba d'être dans le viseur d'Anthropic. Ce dernier l'accuse d’avoir utilisé près de 25 000 comptes frauduleux pour extraire les capacités de ses modèles IA Claude. La campagne, conduite entre le 22 avril et le 5 juin dernier, a généré plus de 28,8 millions d’interactions avec Claude, selon une lettre datée du 10 juin qu’Anthropic a adressée à plusieurs membres influents de la commission des affaires bancaire du Sénat américain, rapporte Reuters. La société dirigée par Dario Amodei affirme que cette opération reposait sur une technique appelée « distillation », qui consiste à entraîner un modèle IA moins performant à partir des réponses produites par un système plus avancé. Cette méthode peut permettre à des concurrents de reproduire une partie des capacités d’un modèle sophistiqué à moindre coût. Selon l’entreprise, la campagne aurait été menée par des opérateurs affiliés à Alibaba et à Qwen, le laboratoire IA du groupe chinois.

Cette accusation intervient alors que les entreprises adoptent de plus en plus les outils IA générative dans leurs différentes activités, mettant les fournisseurs sous pression pour démontrer leur capacité à détecter les usages abusifs tout en maintenant la disponibilité de leurs services pour les clients professionnels. Le différend s’inscrit également dans un contexte de tensions technologiques croissantes entre les États-Unis et la Chine. Anthropic estime que cette campagne aurait pu contribuer à accélérer la capacité de la Chine à atteindre le niveau de performance de son modèle avancé Mythos Preview, tandis que les autorités américaines renforcent leur surveillance des systèmes IA de pointe, craignant qu’ils ne soient utilisés à des fins militaires ou de renseignement par certains pays jugés sensibles. En février, Anthropic avait déjà déclaré avoir identifié des campagnes similaires menées par DeepSeek, Moonshot AI et MiniMax pour extraire les capacités de Claude. Selon l’entreprise, ces activités auraient représenté plus de 150 000 interactions dans le cas de DeepSeek et plus de 13 millions pour MiniMax. Alibaba n’a pas répondu immédiatement aux demandes de commentaires.

Un risque pour la chaîne d’approvisionnement

Si les accusations de la société américaine s’avèrent fondées, cette campagne aurait pu donner à Alibaba la possibilité de développer rapidement un modèle comparable et de le proposer à un coût bien inférieur, estime Anand Joshi, analyste spécialisé dans l’IA chez TechInsights. Pour les analystes, cette affaire dépasse largement le cadre des deux entreprises concernées. Associée aux précédents incidents signalés par Anthropic, elle suggère que le scraping de modèles IA devient un phénomène de plus en plus fréquent plutôt qu’un risque isolé. « La chaîne d’approvisionnement des entreprises ne se limite plus aux logiciels, aux API et aux régions cloud », explique Sanchit Vir Gogia, analyste en chef chez Greyhound Research. « Elle inclut désormais de l’intelligence louée, et cette intelligence louée peut être copiée puis redéployée bien au-delà des mécanismes de contrôle et de sécurité qui l’ont vue naître. » Selon lui, la distillation devrait être considérée comme un sujet relevant directement des conseils d’administration, car un modèle moins performant entraîné à partir d’un modèle plus avancé peut hériter de ses capacités sans pour autant bénéficier de la même gouvernance ni des mêmes garde-fous.

Pour les entreprises utilisatrices, ces accusations mettent en lumière un risque potentiellement plus grave qu’un simple vol de propriété intellectuelle : la rétro-ingénierie à grande échelle. Si elles étaient confirmées, elles démontreraient qu’il est possible de copier méthodiquement des modèles IA, transformant ainsi la distillation de modèles en un nouveau risque pour la supply chain de l’IA. « Si un concurrent peut cloner le cerveau même de l’IA sur laquelle votre entreprise s’appuie, il peut facilement en identifier les failles, compromettre vos systèmes automatisés ou pousser le fournisseur à suspendre des services essentiels à votre activité », avertit Pareekh Jain, CEO de Pareekh Consulting.

Comment atténuer les risques

Ces accusations soulèvent également des questions sur les mécanismes de protection mis en place par les fournisseurs en IA et sur les moyens dont disposent les clients pour se prémunir. « Les fournisseurs devraient proposer des comptes vérifiés, des limitations intelligentes du trafic, des mécanismes de détection des abus, une surveillance des usages, des interdictions contractuelles de la distillation, des procédures de divulgation des incidents et des droits d’audit », estime Pareekh Jain. « Les entreprises devraient demander comment le fournisseur détecte et bloque les tentatives d’extraction de modèles à grande échelle, et exiger des contrats garantissant des plans de secours ainsi que des compensations financières en cas d’attaque ou d’interruption brutale du service. »

Anand Joshi estime également que les clients professionnels doivent exiger davantage de transparence. « Les entreprises doivent demander quelles données ont servi à l’entraînement du modèle, comment celui-ci a été formé, quels garde-fous existent et comment ils peuvent être audités », explique-t-il. Par ailleurs, « les éditeurs de modèles devront également développer des technologies de tatouage numérique (watermarking), à la fois dans les modèles eux-mêmes et dans leurs réponses. Ainsi, si les capacités d’un modèle sont détournées ou copiées, il devrait être possible d’identifier l’auteur du vol. »