Google Cloud a amélioré son entrepôt de données BigQuery avec trois fonctions SQL managées basées sur l'IA pour aider les entreprises à réduire la complexité de l'exécution d'analyses à grande échelle, en particulier sur des données non structurées. Les fonctionnalités ai.if, ai.classify et ai.score (actuellement en préversion publique) sont conçues pour permettre l'utilisation de LLM pour des tâches analytiques portant sur des données structurées et non structurées directement dans les requêtes SQL. Ces fonctions s’exécutent sans personnaliser des prompts ni recours à des outils externes, indique le fournisseur dans un billet de blog. Ces dernières fonctions IA peuvent être utilisées pour filtrer et joindre des données en fonction de leur signification sémantique à l'aide de ai.if dans les clauses where ou on, pour classer des textes ou des images non structurés à l'aide de ai.classify dans les clauses group by, et pour classer des lignes selon des critères de langage naturel à l'aide de ai .score dans les clauses order by.
Traditionnellement, l'intégration des LLM dans les flux de travail SQL pour du raisonnement IA appliqué aux données était une tâche longue, fastidieuse et coûteuse, car elle nécessitait de déplacer des data, de l'ingénierie de prompt, de sélectionner manuellement des modèles et de régler des paramètres, ont souligné les analystes. Le transfert de données est généralement nécessaire en raison de l'incapacité de SQL à comprendre les nuances et la signification des données non structurées, ce qui rend difficile l'analyse avancée de sentiments, de la catégorisation, des avis clients, des tickets d'assistance, des rapports, etc., a déclaré Bradley Shimmin, responsable des données, de l'analyse et de l'infrastructure chez The Futurum Group. Pour contourner cette difficulté, les data analysts devaient souvent exporter les données de l'entrepôt, les envoyer à un data scientist et attendre que celui-ci leur renvoie des données améliorées et catégorisées, adaptées à l'analyse à l'aide de SQL, a noté M. Shimmin, ajoutant que ces dernières fonctions IA « peuvent littéralement réduire l'ensemble de ce workload à une seule requête, en utilisant la syntaxe SQL standard ».
Une demande croissante pour les fonctions SQL basées sur l'IA
Ces fonctions IA managées réduisent les obstacles à l'entrée pour les analystes de données, car ils peuvent désormais adopter une syntaxe compatible avec SQL pour le raisonnement basé sur l'IA des données sans avoir à apprendre l'ingénierie de prompt, a souligné Stephanie Walter, analyste en charge de la practice IA chez HyperFrame Research. « Pour les entreprises, cela signifie un temps d'accès aux informations plus rapide, moins de compétences spécialisées requises et une réduction des coûts opérationnels et des risques », a déclaré l'analyste. Les entreprises tirent également profit de l’aspect managé de ces fonctions, a-t-elle ajouté, en référence à la gestion automatisée en arrière-plan par Google de la sélection des modèles, de l'optimisation des prompts, du paramétrage des plans de requête, et de la gestion des endpoints pour ces fonctions. « Cette approche managée répond aux difficultés rencontrées par les entreprises en matière de complexité et de risques opérationnels : au lieu que les analystes ou les équipes aient à décider quelle variante de modèle utiliser et à optimiser les requêtes en termes de latence et de coût, Google s'en charge », a déclaré Mme Walter.
L'intégration de fonctions SQL basées sur l'IA dans les entrepôts de données est un phénomène de plus en plus répandu. Il s'agit d'un domaine hautement concurrentiel, où tous les principaux fournisseurs prennent des mesures comparables à différents stades de maturité. Alors que Databricks propose déjà des fonctions IA pouvant être utilisées pour appliquer l'IA générative ou l'inférence LLM directement à partir de SQL ou Python, Snowflake fournit les fonctions ai_parse_document, AISQL et Cortex pour l'analyse de documents, la recherche sémantique et l'analyse basée sur l'IA. D'autres entrepôts, tels qu’autonomous data warehouse d'Oracle, prennent également en charge les workflows IA parallèlement à SQL. Selon Phil Fersht, CEO de HFS Research, ces intégrations indiquent une évolution plus large des plateformes de données. « Ces fonctions managées constituent les éléments de base de systèmes plus autonomes. Imaginez des agents capables d'interroger des données, d'interpréter les résultats et de prendre des décisions en temps réel, le tout sans quitter l'entrepôt... donnant ainsi aux données d'entreprise la capacité de penser dans leur propre environnement », a déclaré M. Fersht.