Tirer avantage des fichiers peu exploités, voilà la tâche que Box s’est donné à l’occasion de son évènement Boxworks qui était organisé du 10 au 12 septembre à San Francisco. Il a en effet présenté la fonctionnalité Extract pour approfondir et extraire les informations pertinentes. La technologie d'IA ingère les données, raisonne et extrait le contexte, fait correspondre les modèles, réorganise les informations en les plaçant dans des champs, puis établit des corrélations à partir de la nouvelle structure.

D'une certaine manière, elle restructure les données non structurées grâce à une analyse plus intelligente par l'IA. « Les données non structurées sont à nouveau à la mode. Désormais, il ne s'agit plus seulement de les rendre disponibles dans le cloud, de les sécuriser ou de favoriser la collaboration, mais il faut en plus être en mesure d’utiliser l'IA », a expliqué Ben Kus, directeur technique chez Box.

Une protection des données sensibles à base d’IA

Par ailleurs, une fonctionnalité de sécurité appelée Shield Pro protège les informations contre toute utilisation abusive ou tout accès malveillant. Les mesures de protection améliorent les contrôles manuels en utilisant l'IA pour classer et étiqueter automatiquement les contenus sensibles. Les administrateurs peuvent établir des politiques basées sur l'IA qui identifient automatiquement les informations à classer, plutôt que de taguer manuellement chaque document.

« Cela signifie qu'au moment où un document est téléchargé dans Box, nous l'examinons, nous essayons de comprendre s'il existe des politiques de classification, nous essayons de classer le document, tout en proposant des contrôles de sécurité en aval », a expliqué Manoj Asnani, vice-président de la gestion des produits pour la sécurité et la confidentialité chez Box. Cette fonctionnalité est particulièrement importante dans des secteurs soumis à des procédures règlementaires strictes comme la finance et la santé. La fonctionnalité de sécurité effectue également une analyse des menaces et avertit les administrateurs des menaces de ransomware.

Les données non structurées essentielle pour l'IA

« Box stocke d'énormes quantités de données dans son cloud, et une grande partie de celles-ci n'est pas facilement accessible aux systèmes d'IA des entreprises », a convenu Jack Gold, analyste principal chez J. Gold Associates. « Les données non structurées sont particulièrement difficiles à consolider et à exploiter pour l'apprentissage de l'IA. Si Box parvient à les prétraiter pour en extraire les éléments de connaissance qui peuvent ensuite être intégrés à un système d'IA afin qu'il comprenne mieux les informations locales, c’est un réel avantage », a poursuivi M. Gold.

« Les données personnalisées sont plus précises que celles issues d'un LLM massif formé à partir de données publiques. Elles pourraient donc constituer un bon moyen d'améliorer la précision de l'IA », a-t-il ajouté. « Les systèmes d'IA augmentée formés à partir de données locales plus pertinentes sont plus précis et mieux adaptés pour obtenir les meilleurs résultats. Cela peut s’avérer particulièrement intéressant quand il s’agit de déléguer une tâche à un agent d’IA », a estimé l’analyste.