Tesla est impliqué dans un accident mortel d'un véhicule dont la conduite autonome a été activée.

L'Image du jour

Tesla est impliqué dans un accident mortel d'un véhicule dont la conduite autonome a été activée.

French Tech : Effet pschitt ou vrai accélérateur

Dernier Dossier

French Tech : Effet pschitt ou vrai accélérateur

De la French Touch à la French Tech, c'est le message que Bpifrance a souhaité faire passer aux 30 000 visiteurs (startups, entrepreneurs, PME, ETI, g...

Restez proche de l'actualité IT

NEWSLETTERS THEMATIQUES

Découvrez nos différentes newsletters adaptées à vos besoins d'actualités IT Pro : Mobilité, Réseaux, Stockages, ...

Abonnez-vous 
FERMER

LMI MARKET

Votre comparateur de prestataires IT : Comparez les devis, Evaluez les prestataires, Trouvez le juste prix!...

Accéder à ce service 

BLOG

Découvrez les contenus exclusifs publiés par les lecteurs du Monde Informatique avec la plateforme LMI Blog...

Accéder à ce service 

COMPARATEUR DE SALAIRE

Partagez votre situation salariale anonymement, consultez les statistiques depuis 2009 et faites vos propres analyses...

Accéder à ce service 

IT TOUR

LMI vous invite à sa Matinée-Débats dans votre région.
Inscrivez-vous

Accéder au site 
FERMER
0
Réagissez Imprimer Envoyer

Les data scientists font plus de nettoyage de données que d'analyse

Si les data scientists passent le plus clair de leur temps à nettoyer les données, c'est aussi ce qu'ils aiment le moins faire, montre un sondage du site CrowdFlower.

Si les data scientists passent le plus clair de leur temps à nettoyer les données, c'est aussi ce qu'ils aiment le moins faire, montre un sondage du site CrowdFlower.

Bien que recherchés et difficiles à trouver, les postes de data scientists recrutés parmi les profils les plus avancés passent beaucoup plus de temps à nettoyer et organiser les données qu'à affiner des algorithmes et faire des analyses.

Le métier de data scientist, présenté par des spécialistes du recrutement dont Glassdoor comme l’un des plus intéressants à suivre en 2016, comporte aussi sa face B. Une autre étude publiée par le site CrowdFlower montre que ces profils passent en fait la moitié de leur temps à préparer les données pour l’analyse. Quatre-vingts data scientists, présentant divers niveaux d’expérience, ont été interrogés. S’il faut effectivement un diplôme de troisième cycle pour occuper ces postes, 60% des répondants ont indiqué qu’une grande partie de leur temps était consacrée au nettoyage et à l’organisation des données, ce qui leur laissait en fait peu de temps pour les tâches d’analyse proprement dites nécessitant par exemple de bâtir des trainings sets et d’affiner des algorithmes. « Finalement, l’un des collaborateurs que vous avez eu le plus de mal à recruter se retrouve à passer le plus clair de son temps à nettoyer les données », explique Lukas Biewald, co-fondateur et CEO de CrowdFlower, « c’est un énorme gâchis pour les entreprises ». Des start-ups comme Trifacta ou Datameer se sont pourtant spécialisées dans cette tâche.

Il se trouve aussi que le nettoyage et l’organisation des données représentent généralement la partie de leur travail que les data scientists aiment le moins, selon plus de la moitié de ceux qui ont été interrogés par le site qui propose à leur attention une plate-forme d'enrichissement de données. En dépit de cet inconvénient, plus de 80% des répondants au sondage se disent heureux au travail. CrowdFlower confirme également la difficulté à trouver data scientists dans le monde de l’entreprise. Dans l'enquête qu'il avait mené il y a un an, 79% des sondés constataient cette situation. Cette année, ils sont 83% à le dire. Les compétences les plus recherchées portent sur SQL, Hadoop, Python, Java, R, Hive, MapReduce, NoSQL, Pig et SAS. Viennent ensuite les connaissances en apprentissage machine, ce que plus de la moitié des répondants à l’enquête ont souligné. « Sur les deux dernières années, les CEO se sont demandés quelle est était leur stratégie big data, ils doivent maintenant se pose la question sur le machine learning », estime Lukas Biewald.

Sur le même sujet (CrowdFlower)

Commenter cet article

commenter cet article en tant que membre LMI

CONNEXION

Commenter cet article en tant que visiteur






* Les liens HTML sont interdits dans les commentaires

35 ans
19 Avril 1993 n°541
Publicité
Publicité
Publicité