« Notre première collaboration avec le framework Scikit-learn date de 2013, à cette époque, nous ne parlions pas encore de TensorFlow ou de PyTorch », fait remarquer Léo Dreyfus-Schmidt, Head of Research chez Dataiku, une entreprise franco-américaine qui édite une plateforme collaborative intelligente de data science, et d’ajouter : « Nous utilisons Scikit-learn pour notre plateforme Data Science Studio qui permet de transformer les données brutes en prévisions via du machine Learning ». Bien sûr, comme le précise Léo Dreyfus-Schmidt, Scikit-learn n’est pas le seul framework IA utilisé, l’éditeur exploite aussi les piles d’outils de Kera et de TensorFlow pour entrainer des modèles de deep learning.

Une souplesse d’utilisation

« De mon point de vue, Scikit-learn reste incontournable, ce framework dispose d’une bonne renommée et le côté réassurant est aussi qu’il soit proposé en open source, un vrai gage de transparence. De plus, ses concepteurs ont réussi à le rendre accessible avec son interface de programmation. Ainsi, pour un utilisateur qui n’est pas à l’aise avec le langage Python, il bénéficie d’une certaine souplesse dans le calcul des métriques, le nettoyage des données… , de nombreuses tâches sont automatisées », explique Léo Dreyfus-Schmidt. Il faut savoir que Dataiku est membre du consortium Scikit-learn depuis sa création il y a un peu plus d’un an et apporte aussi, à ce titre, sa contribution dans les améliorations et les nouvelles fonctions du framework. Dataiku n’exploite pas la totalité des fonctions du framework, comme le précise Léo Dreyfus-Schmidt, une réflexion sur l’application est effectuée en amont selon les besoins. De plus, l’emploi de ce type de framework facilite certes une partie du travail mais il reste un important travail pour le rendre actif en production. « Nous y ajoutons de nombreux développements en interne », confirme le responsable de la recherche chez Dataiku qui peut compter sur sa solide équipe R&D d’une cinquantaine de personnes sur un effectif total de 300 collaborateurs.