LMI : Vous venez de lancer votre service GenAI Luminen dans votre solution de cybersécurité Elements sans coût supplémentaire, le prix de l’abonnement va-t-il augmenter dans les prochains mois ?   

Leszek Tasiemski : Nous ne voulons pas que Luminen devienne une nouvelle source de revenus. Il y a bien sûr une raison commerciale derrière toute décision, mais nous voulons que Luminen soit un facteur de différenciation afin de rendre l'IA plus accessible aux petites et moyennes entreprises qui ne peuvent pas se permettre d’utiliser des solutions plus coûteuses. Et vous avez raison, c'est coûteux à exploiter. C'est pourquoi nous sommes en fait très prudents dans le calcul des données qui sont alimentées dans les modèles de LLM, de sorte que nous utilisons le LLM aussi peu que possible. Ainsi, si quelque chose peut être calculé en dehors du modèle, nous le faisons en dehors du modèle et nous n'invoquons le LLM que lorsque c'est nécessaire. Donc, d'une certaine manière, nous l'utilisons très efficacement. Et d'après nos calculs actuels, il semble que nous puissions inclure la fonctionnalité de base de Luminen avec Elements sans augmenter le prix. Avec le temps nous ne savons toutefois pas à quoi ressemblera la charge de travail, alors nous pourrions être obligés d'introduire une version premium de l'abonnement Luminen afin que les fonctionnalités de base soient toujours incluses. Mais plus nous avançons, plus nous étendons la GenAI.    

Quelle est la plateforme technologie derrière Luminen, quel modèle de LLM utilisez-vous ? Je comprends que vous travaillez avec AWS Bedrock.  

Oui, nous travaillons avec AWS et nous utilisons Bedrock. Nous avons travaillé avec différents LLM qui sont disponibles et confirmés sur la plateforme Bedrock.   

Quel LLM utilisez-vous, Mistral, OpenAI... Et le client a-t-il le choix du LLM ou prenez-vous cette décision ?  

Comme nous l'avons déjà dit, nous n'entraînons pas notre propre modèle, mais nous utilisons AWS Bedrock ,et avec Bedrock vous pouvez très facilement changer de modèle. Donc c'est ce que nous faisons. Nous échangeons les modèles et voyons comment ils performent. En ce moment, je pense que nous utilisons Claude 2 ou 3 [Anthropic], mais je ne suis pas sûr. Le fait est que nous basculons très facilement d’un modèle à un autre. Nous avons les données de base et vérifions avec différents modèles comment ils performent et combien cela coûte, car ils viennent avec des coûts différents. Nous essayons de voir comment obtenir de bons résultats avec le modèle moins cher ou est-ce qu’un modèle plus coûteux apporte de meilleurs résultats ? Et si nous voyons que le résultat est le même, nous utilisons le moins cher une fois encore pour garder le prix inchangé et fournir ce service à nos clients sans abonnement supplémentaire. Nous testons les modèles pour la performance, les hallucinations, et ensuite le prix. Donc, nous ne prévoyons pas de permettre aux clients d'utiliser un modèle, c’est trop très complexe et le service pourrait devenir inefficace. Nous proposons Luminen comme un service. Donc plus nous faisons simple, mieux c'est.   

Quel type de données collectez-vous chez les clients pour analyse ?  

Nous construisons toujours les données contextuelles. Donc pour un prompt donné, nous préparons les données en dehors du modèle pour réduire les coûts. Et, nous ne prenons en compte que les données que nous montrons déjà au client. Donc, Luminen peut accéder aux données auxquelles vous pouvez accéder par d'autres moyens à l'intérieur d’Elements. Si quelque chose concerne la confidentialité ou la conformité, que nous ne devrions pas la collecter : nous découpons et filtrons les données à un niveau beaucoup plus bas. Par exemple, nous essayons de ne pas collecter quoi que ce soit qui serait sensible pour respecter le RGPD et les questions de confidentialité. Donc Luminen ne verra même pas cette donnée, car elle est filtrée ou anonymisée à des stades antérieurs autant que possible.    

Tout le traitement de Luminen est assuré sur le cloud sur AWS, avez-vous des centres de données locaux pour vos clients ? Par exemple, en Europe avec AWS, vous avez différentes régions.   

Nous ne supportons actuellement pas le local pour des raisons spécifiques. Certaines parties du logiciel sont en APAC ou en Amérique du Nord. Mais c'est un cloud sécurisé et performant. Donc avec les clients japonais ou asiatiques, ce serait une mauvaise approche au niveau des performances de réaliser des requêtes avec un centre de données européen. Donc cette partie est dupliquée. Si un client vient d'Europe, ses données sont hébergées et traitées en Allemagne conformément au RGPD.  

Vous avez déjà testé Luminen chez des clients, quels sont les premiers retours ?   

Nous avons beaucoup d'utilisateurs pilotes. Luminen a été déployé chez plus de 70 clients. Beaucoup d'entre eux sont satisfaits, ils disent que Luminen leur fait gagner du temps. Ce que nous entendons est donc conforme à ce que nous avions prévu. Il y a aujourd’hui deux demandes de fonctionnalités majeures, et nous savions qu'elles allaient venir. L'une est le reporting mensuel. Le snapshot de sept jours est intéressant pour faire un état de la situation, mais beaucoup de clients doivent également faire un rapport pour le mois complet. Cette requête est arrivée très tôt dans la phase de co-création. L'autre demande que nous avons aussi est l'exploitation de notre base de renseignement sur les menaces (threads intelligence). Nous avons une vaste base de données sur les cybermenaces. Et en ce moment, Luminen est limitée de manière à ne montrer que les informations qui sont déjà dans les événements. Donc, par exemple, s'il y a un nom de domaine, une adresse IP ou le hash d'un fichier, il pourrait rechercher des informations dans notre base de données et montrer pourquoi ce domaine est malveillant. Il pourra vous dire que nous pensons qu'il est malveillant parce qu'il diffuse un malware utilisé dans des campagnes menées par des cybercriminels ou qu’un domaine a été enregistré la semaine dernière pour probablement réaliser du phishing. Si vous utilisez Elements, vous voyez simplement qu'il est malveillant, mais le système ne vous dit pas pourquoi. Nous voulons enrichir ce dernier point afin de préciser qu’il est malveillant à cause de X, Y...Z.  Ce sont les deux plus gros retours clients et nous les avons intégrés à notre plan de développement.