Le langage de programmation Open Source « R » gagne en popularité face aux traditionnelles applications de statistiques telles que SPSS, SAS et Matlab. C'est du moins ce qu'indique dans un billet un statisticien qui l'enseigne. Pour Robert Muenchen, qui gère le support pour la recherche informatique à l'Université du Tennessee, l'été 2014 a marqué un tournant, R devenant le plus utilisé pour les articles scientifiques, dépassant SPSS, tandis que le logiciel Stata progresse aussi de son côté. Toutefois, le délai induit par le processus de publication des articles ne permettra pas de vérifier cette évolution avant 2015, explique-t-il.

Selon M. Muenchen, les citations scientifiques sont un bon indicateur. Les étudiants qui apprennent à utiliser ces logiciels s'en serviront ensuite dans leur contexte professionnel, que celui-ci soit académique ou qu'il se poursuive en entreprise. De sa dernière vérification sur Google Scholar, M. Muenchen montre que les chercheurs continuent à travailler sur les logiciels traditionnels. Pour SPSS, par exemple, il a relevé 75 000 citations dans des articles scientifiques. Le logiciel SAS arrive en 2ème position avec 40 000 citations. Quant à R, il a été utilisé dans 20 000 projets de recherche. Si ces remarques sont intéressantes, il convient de souligner que M. Muenchen n'est pas tout à fait neutre vis-à-vis de R puisqu'il donne des cours pour Revolution Analytics qui commercialise des logiciels basés sur R. Mais il est aussi un expert reconnu dans le domaine analytique et a contribué au code de SAS, SPSS et de plusieurs produits basés sur R. Il a également fait partie du comité consultatif de SAS et SPSS.

Un langage qui bénéficie d'une communauté active

Dans son billet, M. Muenchen ne commente pas les raisons pour lesquelles R gagne en popularité. Interrogé par nos confrères d'IDG News Service, Al Hilwa, analyste du cabinet d'études IDC, pointe le fait qu'il peut être téléchargé gratuitement par les chercheurs qui démarrent un projet. « Comme beaucoup de projets Open Source ayant des communautés actives, il s'est amélioré avec le temps », ajoute-t-il. Pour lui, ces tendances se mettent en place dans la durée. L'acquisition de compétences de développement autour de langages de programmation prend du temps, rappelle-t-il. Il s'agit donc d'un effet décalé qui reflète une utilisation réelle.

Le langage R est par ailleurs inclus dans de nombreuses solutions commerciales, notamment pour le traitement des big data et les environnements Hadoop. Oracle, par exemple, le propose avec son appliance Big Data. SAP l'a aussi inclus dans plusieurs offres. Pour ne citer qu'eux.