Les applications de l'IA se nichent parfois dans des endroits improbables. En l'occurrence avec Zipline il faut tourner les yeux vers le ciel. En effet, il s'agit d'un service de livraison par drone dont la mission est de fournir rapidement des fournitures médicales vitales, notamment du sang, des vaccins et des équipements de protection individuelle. Les drones de l'entreprise ont parcouru plus de 8 millions de kilomètres dans plusieurs pays et effectué plus de 115 000 livraisons commerciales, y compris l'approvisionnement d'hôpitaux et de cliniques dans certaines des communautés les plus reculées du monde.

La société conçoit, assemble et exploite son système d'aéronef sans pilote aux États-Unis et progresse vers la certification FAA de ses drones pour ses opérations américaines. « L'IA et le ML ont été plus ou moins « intégrés » à Zipline dès le début », explique Matt Fay, responsable de l'équipe chargée des données au sein de l'entreprise. « Je ne pense pas que vous puissiez concevoir une flotte de drones autonomes sans ces outils. »

Dans les premiers temps, avant que Zipline ne compte des centaines d'heures de vol chaque jour, il était difficile de collecter suffisamment de données pour entraîner des algorithmes et optimiser les trajets, explique Mr. Fay. « Ce n'est que lorsque nous avons commencé à voler, à livrer des produits médicaux tous les jours au Rwanda, que nous avons recueilli suffisamment de données pour avoir besoin de nouveaux outils », dit-il.

Une approche basée sur le cloud

À l'époque, la motivation de l'entreprise était double, explique Mr Fay. « Tout d'abord, nous voulions passer d'un flux de travail local - des ingénieurs téléchargeant et analysant un lot de vols sur leurs propres machines - à une approche basée sur le cloud, où tout l'historique de nos vols était déjà disponible », explique-t-il.

Deuxièmement, Zipline souhaitait créer un environnement d'analyse doté de puissantes capacités de traitement par lots et d'un espace de travail commun et collaboratif. L'équipe de développeurs maîtrisait déjà le langage Python, et l'entreprise a donc déployé Jupyter Notebook, une application web open source qui permet aux utilisateurs de créer et de partager des documents contenant du code en direct, des équations, des visualisations et du texte narratif, fonctionnant sur un cluster de moteurs d'analyse Apache Spark.

L'élément clé est une plateforme de science des données et d'apprentissage automatique de Databricks, qui combine un environnement basé sur le cloud avec des flux de données provenant des différentes opérations de Zipline - tout, des journaux de vol à la maintenance en passant par le suivi de la provenance et de l'état des pièces et des stocks dans chaque centre de distribution.

Une démocratisation de la donnée

« Databricks étant un environnement partagé et collaboratif, nous sommes en mesure d'investir dans la plateforme : créer notre propre ensemble d'utilitaires pour le traitement par lots, maintenir une bibliothèque de traçage de nos visualisations de données les plus utiles pour les vols, créer un ensemble simple de didacticiels et un programme de formation pour intégrer les nouveaux membres de l'équipe », explique Matt Fay.

Lorsque la plupart des gens pensent à des initiatives de « démocratisation des données », ils pensent généralement à des plateformes de tableaux de bord qui donnent accès à des analyses ». « Bien qu'il s'agisse d'une partie importante de l'arsenal de toute équipe de données solide, avec [la plateforme Databricks], nous avons pu démocratiser la science des données, en donnant à chacun dans l'entreprise la possibilité de combiner, d'explorer, de visualiser et d'agir sur toutes les données de Zipline ».

Cette capacité largement disponible a aidé Zipline à fournir un meilleur service. Les clients de l'entreprise, les systèmes de santé qu'elle dessert, « comptent sur nous pour livrer de manière fiable et en temps voulu les médicaments essentiels », ajoute M. Fay. « Pour y parvenir, il faut plus qu'un avion fiable ; il faut une capacité opérationnelle suffisante à chaque étape du processus d'exécution d'une commande ».

Recalibrer l'outil en temps réel

Une livraison d'urgence peut être retardée pour un grand nombre de raisons, allant du manque de personnel sur place pour choisir et emballer chaque produit, à l'absence de batteries pleinement chargées. « Afin de comprendre les problèmes et les goulots d'étranglement dans le système plus vaste qu'est un centre de distribution Zipline, notre équipe a construit un outil de simulation basé sur des événements, modélisant chaque étape de la livraison de produits médicaux », explique Matt Fay.

Sans ajuster cette simulation aux « données réelles » tirées des opérations de Zipline, « cet outil serait inutilement imprécis", précise Mr Fay. « Ce n'est qu'une fois ce calibrage terminé que nous pouvons poser toutes sortes de questions hypothétiques inestimables et y répondre : Comment l'ouverture de trois nouveaux sites de livraison va-t-elle influencer notre taux de ponctualité dans ce centre de distribution ? Si nous augmentons notre taux de charge de 10%, de combien de batteries et de chargeurs en moins aurons-nous besoin ? Quel est le meilleur algorithme pour répartir les avions ? ».

Zipline a constaté que les résultats de cet outil ont un impact sur pratiquement toutes les équipes de l'entreprise. « Pour cette raison, ainsi que pour la facilité de calibrage et de mise à jour en continu du modèle, nous avons choisi de l'héberger dans Databricks », explique Matt Fay. « Cela permet aux analystes ayant des besoins différents dans toute l'entreprise de voir les mêmes résultats de simulation et d'étudier les parties pertinentes ». Pour les clients de Zipline et leurs patients, la technologie a permis une livraison plus fiable des fournitures vitales.