Flux RSS

Décisionnel

Si vous souhaitez recevoir toute l'information "Mot Clé" de notre feed RSS,Inscrivez-vous

609 documents trouvés, affichage des résultats 11 à 20.

< Les 10 documents précédentsLes 10 documents suivants >


(05/01/2012 17:08:58)

22 outils gratuits pour visualiser et analyser les données (2ème partie)

Pour faire parler des données, rien ne vaut une panoplie d'outils de visualisation graphique. Pour ceux dont le budget est limité, il existe de nombreux outils gratuitement accessibles pour visualiser les données et faire apparaître des modèles ou des tendances. Au printemps dernier, Sharon Machlis, de Computerworld, en a listé plus de vingt, qu'elle a répartis en neuf catégories : nettoyage de données, analyse statistique, outils et services de visualisation (1ère partie publiée le 3 janvier), outils de développement, SIG, analyse de données temporelles, nuages de mots, visualisation de données relationnelles (2e partie). Les bibliothèques JavaScript et les interfaces de programmation (API) s'adressent aux développeurs.

Pour relire la 1ère partie, «22 outils gratuits pour visualiser et analyser les données»

- Assistants, bibliothèques et API

Il faut quelquefois écrire du code pour produire certaines visualisations, en particulier quand le type d'affichage que l'on veut obtenir ne peut être réalisé qu'en recourant à une application desktop ou web existante. Cela ne signifie pas que l'on doive partir de rien, plusieurs bibliothèques et API fournissant déjà divers éléments.

10 - Choosel : pour enrichir les applications Google Web Toolkit

Ce framework Open Source disponible en mode web est destiné à la réalisation de graphiques sectoriels, de nuages, d'histogrammes, de diagrammes chronologiques et de cartographies. Il s'adresse davantage aux développeurs qu'aux utilisateurs. On peut néanmoins consulter une démo interactive qui explique comment importer des données en utilisant des fichiers CSV. Disponible sous licence Apache 2.0, il a trois champs d'applications principaux : l'exploration visuelle de données, les infographies interactives, la visualisation de données dans les applications GWT (le framework de développement Java Google Web Toolkit), peut-on lire sur code.google.com.

Comme avec Tableau Public, plusieurs visualisations peuvent s'afficher sur une page en étant reliées, de telle sorte que l'on peut, par exemple, mettre en valeur certaines données sur une carte en passant la souris sur un graphique associé.

Choosel
Choosel (cliquer ici pour agrandir l'image)

Niveau de compétences requis : Expert.
Fonctionne à partir de Chrome, Safari et Firefox.
En savoir plus :  http://code.google.com/p/choosel/

11 - Exhibit : une bibliothèque JavaScript

Issu du projet Simile conduit par le MIT, le logiciel Open Source Exhibit, sous licence BSD, permet de « créer facilement des pages web comportant des fonctionnalités de recherche et de filtrage, des cartographies interactives, des échelles chronologiques et autres visualisations », décrit le site Simile-widgets.org/exhibit. Présenté comme un framework de publication, cette bibliothèque JavaScript permet d'ajouter facilement des filtres et des recherches. Sharon Machlis, de Computerworld, fait néanmoins remarquer que ce qui est jugé « facile » par les professionnels du MIT ayant créé Exhibit peut ne pas l'être autant pour un utilisateur qui connaît surtout Excel. Comme la plupart des bibliothèques JavaScript, Exhibit requiert d'écrire davantage de lignes de code que des services tels que Many Eyes et Google Fusion Tables. Cela dit, il propose une documentation claire pour les débutants, même pour ceux qui n'ont pas d'expérience JavaScript.

Si l'écriture de code ne vous pose pas de problèmes, vous avez des chances de vous approcher au plus près des présentations que vous voulez réaliser. Et vos données restent stockées localement, sauf si vous souhaitez les publier. Pour les novices, il faudra un peu de temps pour se familiariser avec l'écriture de code et la syntaxe de la bibliothèque.

Exhibit
Exhibit (cliquer ici pour agrandir l'image)

Niveau de compétences requis : Expert.
En savoir plus : http://www.simile-widgets.org/exhibit/

12 - Google Chart Tools : des graphiques statiques et interactifs

Contrairement à Google Fusion Tables qui est comme une application à part entière pour stocker des données en ligner et générer graphiques et cartes, Chart Tools est conçu pour visualiser des données résidant ailleurs, par exemple sur un site web ou au sein de Google Docs. Il offre à la fois les API Chart utilisant une simple requête URL vers un serveur de graphiques Google pour créer une image statique, et l'API Visualization qui accède à une bibliothèque JavaScript pour bâtir des graphiques interactifs. Avec celle-ci, on n'échappe pas à l'écriture de code. Google donne des informations (taille des données, compétences requises...) pour déterminer quelle option retenir.

Pour les graphiques statiques les plus simples, un assistant fournit quelques exemples. Il va jusqu'à aider à saisir les données ligne par ligne, quoi qu'à partir d'une certaine taille, il est plus logique de formater celles-ci dans un fichier texte.

Google Chart Tools
Google Chart Tools (cliquer ici pour agrandir l'image)

Niveau de compétences : débutant avancé et expert.
Fonctionne sur tout navigateur.
En savoir plus : http://code.google.com/apis/chart/image/docs/making_charts.html

[[page]]

13 - JavaScript InfoVis Toolkit : de superbes graphiques

InfoVis ne compte sans doute pas parmi les bibliothèques de visualisation JavaScript les mieux connues, mais elle vaut vraiment la peine d'y jeter un oeil si vous voulez permettre la consultation de données interactive sur le web. Elle a été utilisée par la Maison Blanche pour créer le graphique présentant le budget de l'administration Obama.

Ce qui différencie cet outil des autres est l'apparence très léchée des graphiques qu'il réalise avec des exemples simples de code. Visiblement, le créateur d'InfoVis, Nicolas Garcia Belmonte, développeur senior chez Sencha Inc, s'intéresse autant à l'esthétique du dessin qu'à celle du code et ça se voit.

Les échantillons présentés sont superbes. On peut télécharger uniquement le code pour les types de visualisations que l'on veut utiliser pour réduire la taille des pages web. Attention, comme il ne s'agit pas d'une application mais d'une bibliothèque de code, il faut savoir développer pour l'utiliser. Par conséquent, cela peut ne pas convenir à des utilisateurs en entreprise qui analysent les données mais ne savent pas programmer. Par ailleurs, le choix du type de visualisation est limité. Enfin, les données doivent être au format JSON.

JavaScript InfoVis Toolkit (JIT)
InfoVis Toolkit (cliquer ici pour agrandir l'image)

Niveau de compétences : expert.
Fonctionne sur les navigateurs compatibles JavaScript.
En savoir plus : démos avec code source (http://thejit.org/demos/)

14 - Protovis : une bibliothèque bien documentée

Présenté comme un toolkit graphique pour la visualisation, ce projet de l'Université de Stanford est l'une des bibliothèques JavaScript les plus populaires pour transformer les données en visuels. Une des choses les plus intéressantes à propos de cet outil est sa documentation. Celle-ci comporte de nombreux exemples des types de visualisation disponibles, incluant des cartes et quelques analyses statistiques. C'est un bon outil, permettant de construire des représentations telles qu'une carte associée à une échelle chronologique.

De la même façon qu'avec les autres bibliothèques JavaScript, il faut connaître ce langage (ou tout au moins être familier d'un autre langage). Même s'il est possible de copier, coller et modifier du code sans vraiment comprendre ce que l'on fait, il est difficile de recommander cette approche à des non-techniciens.

Protovis
Protovis (cliquer ici pour l'image)

Niveau de compétences : expert.
Fonctionne sur les navigateurs compatibles JavaScript.
En savoir plus : comment démarrer avec Protovis


- Les systèmes d'information géographique sur poste de travail

Il existe de nombreuses applications pour les SIG (systèmes d'information géographique), allant de l'affichage des sites d'extraction pétrolier au choix de nouvelles implantations pour des magasins. Comme le Miami Herald l'a fait (le magazine a obtenu le prix Pulitzer pour sa couverture de l'ouragan Andrew), il est possible de comparer les vitesses maximum des bourrasques avec les dégâts constatés (pour s'apercevoir, par exemple, que les dommages les plus importants n'ont pas été subis dans les zones où le vent a été le plus fort, mais dans des endroits nouvellement construits où les constructions n'étaient pas de bonne qualité).

15 - Quantum GIS (QGIS) : une alternative à ArcView

C'est un SIG à part entière, conçu pour créer des cartes et qui permet des analyses de données détaillées et avancées par zones géographiques. L'application SIG desktop la plus connue est sans doute ArcView, d'Esri, qui coûte un certain prix, mais s'accompagne d'un solide support professionnel. L'alternative Open Source est QGIS, comme OpenOffice peut l'être pour Microsoft Office. A noter qu'Esri a récemment lancé une offre découverte de son SIG pour un usage privé. Les passionnés d'ArcView considèrent qu'Esri offre deux ans d'avance sur ses alternatives Open Source, que son interface est meilleure et qu'il est mieux adapté pour les impressions. De leur côté, les utilisateurs de QGIS soulignent l'excellence du produit Open Source et pointent ses performances lorsqu'il est question de générer des cartes pour le web, grâce à un plug-in spécialisé dans la génération d'images de cartes en HTML.

Quoi qu'il en soit, avec tout SIG avancé, apprendre le maniement du logiciel demande un sérieux engagement. Cela prend du temps. Certaines choses sont plus faciles à faire avec la version commerciale ArcView, a noté pour sa part Sharon Machlis, de Computerworld, qui a pris en main ArcView et QCIS. Elle explique qu'ArcView dispose d'une fonction normalisée pour calculer, par exemple, le pourcentage de personnes de 65 ans et plus au sein d'une population dans une table comportant les deux colonnes. Dans QGIS, il lui fallait appeler un champ calcul et créer une nouvelle colonne avec la formule pour l'obtenir.

Quantum GIS (QGIS)
Quantum GIS (cliquer ici pour agrandir l'image)

Niveau de compétences : Intermédiaire et expert.
Fonctionne sur Linux, Unix, Mac OS X et Windows. L'installation sur OS X nécessite la mise en place de plusieurs compléments. 
En savoir plus : http://www.plantsciences.ucdavis.edu/plant/qgislabs.htm

On trouve d'autres solutions SIG en Open Source sur Spatialanalysisonline.com. A regarder aussi, un outil comme Post-GIS qui permet d'ajouter des objets géographiques à la base de données relationnelle PostgreSQL.
[[page]]
- Les solutions de cartographie en ligne

Certains outils de cartographie en ligne sont devenus très populaires. Celui de Google, bien sûr, qui dispose en outre de plusieurs compléments tels que Map A List, un add-on qui ajoute à une carte Google Map des données provenant d'un tableur. Il y a aussi Yahoo Maps Web Services, et Bing Maps, de Microsoft qui comportent également des API. Il en existe beaucoup d'autres venant de petites sociétés ou de contributeurs Open Source individuels : des outils, entièrement développés en partant de zéro, pour afficher des données sur des cartes géographiques.

16 - OpenHeatMap : des cartes en couleurs très faciles à créer

Ce site web convivial génère des cartes dont les couleurs se modifient   en fonction des informations sous-jacentes : l'évolution d'une population ou d'un revenu moyen, par exemple. On peut aussi placer sur une carte des marqueurs dont la taille varie en fonction des données qui figurent dans la table associée. 
En plus de fournir ce service sur le web, son auteur Pete Warden (qui fut un temps développeur chez Apple, notamment sur Final Cut Studio) a également packagé OpenHeatMap sous la forme d'un plug-in JQuery pour ceux qui ne veulent pas dépendre de l'hébergement de OpenHeatMap.com. Toutefois, tous les formats de données ne fonctionnent pas correctement lorsqu'ils sont stockés localement. Pete Warden conseille d'intégrer les cartes depuis le site.

Selon Sharon Machlis, de ComputerWorld (qui a dressé cette liste il y a quelques mois), il est très facile de créer rapidement une carte en couleurs à partir de nombreuses sources de données de localisation, même des adresses IP. « Cela m'a pris environ 60 secondes pour créer une carte présentant les séismes de magnitude 7 et plus dans le monde depuis janvier 2000 », indique-t-elle dans son article (cf image ci-dessous). Les tailles, les couleurs et la transparence des marqueurs se personnalisent aisément.
Inconvénient signalés : les données ne peuvent pas être supprimées une fois mises en ligne.

OpenHeatMap
OpenHeatMap (cliquer ici pour agrandir l'image)

Niveau de compétences : débutant.
Fonctionne sur les navigateurs web compatibles Flash ou HTML 5 Canvas.
En savoir plus : http://www.openheatmap.com/gallery.html

17 - OpenLayers : insérer des cartes dans des pages web

Cette bibliothèque JavaScript pour intégrer des cartes d'informations dynamiques dans des pages web. Elle fonctionne avec OpenStreetMap et d'autres services comme Google Street View. Il est destiné à apporter des fonctionnalités similaires à celles de ces bibliothèques, mais en Open Source. D'autres projets s'en servent pour ajouter des fonctionnalités ou une facilité d'utilisation. C'est le cas de GeoExt qui l'utilise pour apporter des fonctions SIG. OpenLayers peut intéresser les utilisateurs qui connaissent JavaScript et préfèrent se tourner vers une option non commerciale (plutôt que recourir à Google ou Bing).

Niveau de compétences : expert
Fonctionne sur tout navigateur web.
En savoir plus : http://openlayers.org/

Il y a d'autres bibliothèques JavaScript pour incruster des informations sur les cartes, telles que Polymaps. Il existe également d'autres plateformes de cartographies : Google Maps et ses nombreuses API, Yahoo Maps Web Services, Bing Maps et GeoCommons.

18 - OpenStreetMap : une cartographie communautaire

C'est un peu le Wikipedia de la cartographie, doté de fonctions de routes ou d'immeubles auxquelles ont contribué différents utilisateurs dans le monde. L'intérêt principal, c'est son caractère communautaire qui a débouché sur des utilisations intéressantes. Il est par exemple compatible avec la plateforme mobile Ushahidi http://www.ushahidi.com/
utilisée pour récupérer des informations après les tremblements de terre en Haïti et au Japon (alors que Ushahidi peut utiliser plusieurs fournisseurs pour les couches cartographiques, en incluant Google et Yahoo, certains créateurs de projets se sentent plus à l'aise avec des solutions en Open Source).

Inconvénients : Comme pour tout projet acceptant les contributions publiques, il peut y avoir des problèmes d'exactitude certaines fois sur les informations fournies (sur le positionnement de certains services sur les cartes, par exemple). Quoi que ce genre de choses peut arriver avec Google Maps. Par ailleurs, l'apparence des cartes est moins bonne que celles des produits commerciaux concurrents.

OpenStreetMap.org
OpenStreetMap.org (cliquer ici pour agrandir l'image)

Niveau de compétences : débutant avancé et intermédiaire
Fonctionne sur tout navigateur web.
En savoir plus : http://www.openstreetmap.org/
http://openstreetmap.fr/

[[page]]
- Analyse de données temporelles


19 - TimeFlow : les concepteurs du projet ont rejoint Google

Ce logiciel pour poste de travail a été développé pour analyser des données ayant une composante temporelle. Ses créateurs, Fernanda Viégas et Martin Wattenberg (tous deux se trouvant derrière le projet Many Eyes d'IBM) ont créé la société Flowing Media, un studio de visualisation spécialisé sur les groupes médias et les projets grand public http://hint.fm/about/. Ils ont rejoint Google en 2010 pour diriger son groupe de visualisation de données Big Picture.

TimeFlow
TimeFlow (cliquer ici pour agrandir l'image)

En savoir plus : https://github.com/FlowingMedia/TimeFlow/wiki

- Les nuages de mots et de textes


Certaines spécialistes de la visualisation de données n'aiment guère ces nuages qui affichent les mots d'un fichier texte en faisant varier leur taille en fonction du nombre de fois où ils figurent dans le fichier. Ils ne les trouvent pas sérieux ou jugent qu'ils ont été trop utilisés. Ceux qui veulent néanmoins y recourir peuvent se tourner vers trois outils.

20 - IBM Word Cloud Generator : dans Many Eyes


Plusieurs des outils déjà cités dans la liste établie par Computerworld permettent de créer des nuages de mots. C'est le cas de l'API Visualization de Google et de Many Eyes où l'on trouve Word-Cloud Generator. On peut aussi le faire avec Wordle http://www.wordle.net/ (un outil pratique pour créer ces nuages à partir de sites web plutôt que de fichiers texte).

Word Cloud Generator dans Many Eyes d'IBM
Word Cloud Generator dans Many Eyes (cliquer ici pour agrandir l'image)

- Outils d'analyse de réseaux sociaux

Ces outils se réfèrent à la définition SNA (social network analysis) pré-Facebook/Twitter. Ils servent à rechercher des liens entre des individus en s'appuyant sur différents jeux de données. Il est nécessaire d'avoir des notions de statistiques pour les utiliser.

21 - Gephi : pour établir des relations dans un réseau complexe

Présenté comme un Photoshop pour les données. Ce projet Open Source est conçu pour visualiser des informations statistiques, incluant des relations au sein de réseaux de type graphe comptant jusqu'à 50 000 noeuds et un demi-million de connexions, de même que l'analyse de facteurs tels que l'intermédiarité, la proximité auxquels s'ajoute un coefficient d'agglomération.

Gephi
Gephi (cliquer ici pour agrandir l'image)

Fonctionne sur Windows, Linux, Mac OS X avec Java 1.6
En savoir plus : http://gephi.org/

22 - NodeXL : plug-in pour Excel pour explorer Twitter et Flickr

Ce plug-in pour Excel affiche des graphes de réseaux à partir d'une liste de connexions, afin d'aider à dégager des modèles et des liens entre les données. NodeXL combine l'ancienne et l'actuelle définition de SNA. Il est optimisé pour analyser les médias sociaux en ligne. Il intègre notamment des connexions pour appeler les API de Twitter, Flickr et YouTube, ce qui permet de dessiner des réseaux d'utilisateurs et leurs activités, explique Peter Aldhous, responsable du bureau de San Francisco du magazine New Scientist.

NodeXL
NodeXL (cliquer ici pour agrandir l'image)

Fonctionne sur Excel 2007 et 2010 sur Windows.
En savoir plus : http://nodexl.codeplex.com/

(...)

(04/01/2012 10:14:37)

Pour renforcer ses actions marketing, Adeo s'appuie sur l'outil décisionnel Vectorwise

Le groupe Adeo représente 24 sociétés dans 12 pays spécialisées dans la distribution autour du bricolage (deuxième rang européen, quatrième mondial). Il fédère des grandes surfaces comme Leroy Merlin, des magasins de proximité (Aki, Bricocenter, Weldom), des magasins-dépôts (Bricoman et Bricomart), ainsi que les enseignes de plusieurs autres concepts, comme Dompro, Zodio et KBane. Ce groupe souhaite pouvoir multiplier les actions marketing dans des délais très courts comme signaler une promotion par SMS aux consommateurs indiquant par géolocalisation qu'ils passent près d'un magasin.

Le décisionnel du groupe repose sur de très gros volumes de données : références produits, ventes, tickets de caisse, etc. Les outils décisionnels classiques dont il disposait ne lui suffisaient pas. Il souhaitait pouvoir y ajouter un outil analytique agile permettant des développement applicatifs rapides.

Déjà client des technologies de bases de données Ingres d'Actian, Adeo a choisi le décisionnel Vectorwise. Cet outil inclut la possibilité de développer des Actions Apps. Il s'agit d'applications légères pouvant se déclencher sur un événement de modification de données. Les Actions Apps permettent donc de déclencher des actions marketing sur atteinte d'une valeur seuil dans un champ ou une modification d'une donnée. Le coût et le calendrier des déploiements d'Actions Apps n'ont pas été communiqués.
(...)

(03/01/2012 16:55:03)

22 outils gratuits pour visualiser et analyser les données (1ère partie)

Pour faire parler des données, rien ne vaut une panoplie d'outils de visualisation graphique. Il en existe de nombreux, notamment destinés aux professionnels versés dans l'analyse statistique. Mais leur prix, généralement élevé, ne convient pas aux utilisateurs moins spécialisés qui n'ont besoin qu'occasionnellement d'afficher des données sous une forme graphique. Or, il existe, pour ceux dont le budget est limité, un nombre surprenant d'outils très intéressants pour la visualisation et l'analyse de données, accessibles gratuitement. Au printemps dernier, Sharon Machlis, de Computerworld, en a listé plus de vingt, qu'elle a répartis en neuf catégories : nettoyage de données, analyse statistique, outils et services de visualisation (1ère partie), outils de développement, SIG, analyse de données temporelles, nuages de mots, visualisation de données relationnelles (2ème partie publiée le 5 janvier). Ils permettent de manipuler les données et de les afficher à travers de multiples représentations graphiques. Particulièrement utiles pour faire apparaître des modèles ou des tendances. La plupart d'entre eux avaient été présentés lors de la conférence Computer-Assisted Reporting (la prochaine conférence CAR aura lieu du 23 au 26 février 2012, à Saint-Louis, Missouri). 

-  Nettoyage de données

Avant toute analyse ou visualisation, les données ont souvent besoin d'être nettoyées, afin de standardiser leur transcription ou de corriger des fautes. Dans une même base, les noms de ville ou de clients, par exemple, peuvent être avoir été saisis de différentes façons (Net York, New York City, NY..., Société Lambda, Lambda, Sté Lambda, Lambda Sarl...). On trouve deux outils destinés à cet usage : DataWrangler et Google Refine. 

1 - DataWrangler : uniquement en ligne

Ce service web du groupe Visualization de l'Université de Stanford est conçu pour nettoyer et réarranger les données sous une forme pouvant être reconnues par d'autres logiciels : les tableurs, mais aussi un langage tel que « R », ou des logiciels commerciaux comme Tableau ou Open Source comme Protovis. En cliquant sur une ligne ou une colonne, cet outil va suggérer des modifications. Par exemple, il proposera de supprimer les lignes vides. Il conserve l'historique qui facilite un retour en arrière (undo), une fonctionnalité également disponible dans Google Refine). 

Computerworld souligne que la correction des textes se fait simplement. En revanche, le service étant disponible en ligne (à partir de tout navigateur), cela implique que les données transitent vers un site externe, ce qui le rend inapproprié pour des informations internes sensibles. Une version « poste de travail » est prévue. Autre élément important, l'outil est toujours en cours de développement.

DataWrangler
DataWrangler (cliquer ici pour agrandir l'image)

Niveau de compétences requis : débutant avancé.
Fonctionne sur tout navigateur web.
En savoir plus : http://vis.stanford.edu/wrangler/

2 - Google Refine
: comme un tableur

Il ressemble à un tableur pour examiner à la fois les données numériques et alphanumériques, mais à l'inverse du tableur, il ne permet pas d'effectuer des calculs. Comme Excel, il peut importer et exporter dans différents formats, incluant les fichiers tabulés, textes, Excel, XML et JSON.

Refine intègre plusieurs algorithmes retrouvant les mots orthographiés différemment mais qui devraient en fait être regroupés. Il y a aussi des options pour passer rapidement en revue les données numériques. Ces fonctionnalités peuvent pointer des anomalies pouvant résulter d'erreurs de saisie, telles que 800 000 dollars à la place de 80 000 dollars pour un salaire par exemple, ou mettre à jour d'autres incohérences. Inconvénient, si le jeu de données est volumineux, son examen peut prendre un certain temps. A noter que Refine propose aussi des outils de tri et de filtre.

Google Refine
Google Refine (cliquer ici pour agrandir l'image)

Niveau de compétences requis : débutant avancé. La connaissance des concepts d'analyse de données est plus importante que la prouesse technique. Les utilisateurs avancés d'Excel qui ont l'habitude du nettoyage de données devraient être à l'aise avec cet outil.
Google Refine fonctionne sur Windows, Mac OS X et Linux. 
En savoir plus : http://code.google.com/p/google-refine/ [[page]]


-  Analyse statistique

3 - Le projet R : un langage pour l'univers des statistiques

Projet GNU similaire au langage S, développé par les Laboratoires Bell (anciennement AT&T, désormais Lucent Technologies) par le statisticien John Chambers. Il peut être considéré comme une mise en oeuvre différente de S, même s'il y a d'importantes différences, une grande partie du code écrit pour S fonctionnant de la même façon sous R, explique-t-on sur le site du projet. Il compile et fonctionne sur de nombreuses plateformes Unix, ainsi que sous Windows et MacOS. S'il s'agit de déterminer des moyennes, des valeurs médianes, des écarts types ou des corrélations, R peut le faire et bien plus encore, en incluant les modèles linéaires, les modèles de régression non linéaires, l'analyse des séries chronologiques, les tests paramétriques et non paramétriques, les classifications, le lissage, indique encore le site web. « R » fournit aussi nombre de représentations graphiques, ainsi que des capacités d'analyse spatiale, et se complète de nombreux add-ons.

Inconvénient, l'environnement utilise des lignes de commandes, ce qui nécessite un minimum d'apprentissage pour connaître les commandes à mettre en oeuvre. Pour les utilisateurs qui souhaitent disposer d'une interface graphique, Peter Aldhous, du bureau de San Francisco du magazine New Scientist, suggère RExcel qui propose d'accéder au moteur de R à partir d'Excel. On peut rencontrer une autre limite avec les jeux de données trop importants. Pour la franchir, il existe une option commerciale de la plateforme, fournie par Revolution Analytics.

Projet R, langage pour l'analyse statistique
L'environnement R (cliquer ici pour agrandir l'image
Niveau de compétences : intermédiaire ou avancé. La connaissance des statistiques facilite la prise en main.
R fonctionne sur Linux, Mac OS X, Unix, Windows XP et ultérieurs.
En savoir plus : le projet R
Premiers pas avec R, de Peter Aldhous


- Outils et services de visualisation

Ces outils offrent différentes options de visualisation. Certains se cantonnent aux graphiques conventionnels (représentations sectorielles, histogrammes...), mais la plupart proposent un éventail de choix supplémentaires tels que les Treemap pour afficher les données hiérarchisées ou les nuages de mots. Quelques-uns disposent aussi de représentations géographiques. Dans ce domaine, il existe toutefois des logiciels gratuits spécifiques.

4 - Google Fusion Tables : simple à utiliser et personnalisable

C'est l'une des plus simples façons de transformer des données en graphiques. On met en ligne son fichier (dans différents formats) et on choisit comment l'afficher : sous forme de tableau, de carte, de bargraphe, de camembert, de « heat map », de diagramme de dispersion, d'historique, d'animation... C'est assez personnalisable. Il est notamment possible de changer les icônes des cartes et le style des fenêtres d'information. Fusion Tables comporte aussi des fonctions d'édition de données, quoi que cela devient vite fastidieux dès que l'on commence à devoir modifier au-delà que quelques cellules. On peut aussi faire des jointures de table (important quand les données à afficher se trouvent dans différentes tables), filtrer, trier, ajouter des colonnes et commenter les données.

Un exemple d'utilisation de Google Fusion Tables (source WNYC)
Un exemple d'utilisation de Fusion Tables (source WNYC)

Niveau de compétences : débutant.
S'utilise avec tout navigateur web.
En savoir plus : Google Fusion Tables

5 - Impure : un peu comme un Yahoo Pipes

Impure est une sorte de « Yahoo Pipes » adapté à la visualisation de données, conçu pour créer de nombreux types de représentations graphiques très peaufinées en utilisant un espace de travail de type « drag and drop ». Le service inclut une bibliothèque d'objets et de méthodes. Et, comme avec Yahoo Pipes, il permet de cliquer et déplacer pour connecter des modules de façon à ce que les « sorties » (output) de l'une deviennent les « entrées » (input) d'une autre. L'outil a été développé par la société d'analyse espagnole Bestiario.
Impure présente l'intérêt d'offrir une interface très visuelle pour préparer les représentations graphiques, ce qui n'est pas aussi fréquent qu'on pourrait s'y attendre. Il offre une interface élégante et de nombreux modules, dont quelques API (interfaces de programmation) destinées à extraire des données du Web.

On peut chercher par mots-clés (numeric, tables, nodes, geometry, map) ses nombreux types de visualisation. Et bien qu'il sauvegarde votre espace de travail sur le Web, il est possible de copier et conserver le code localement, afin de sauvegarder son travail et de mettre à jour ses propres bibliothèques de code.
Attention, les utilisateurs d'Impure devront faire un effort d'apprentissage malgré les fonctionnalités drag and drop. La documentation est quelquefois détaillée, mais pas toujours. Une fois que l'espace de travail est sauvegardé, il devient public sur le web, bien qu'il soit difficile de le retrouver sans l'URL.

Impure
Impure (cliquer ici pour agrandir l'image)

Niveau de compétences : intermédiaire.
Fonctionne sur tout navigateur.
En savoir plus : sur Impure
[[page]]

6 - Many Eyes : facile d'accès et bien documenté

Le projet Many Eyes d'IBM est l'un des pionniers de la visualisation de données sur le web. Il est très facile à utiliser et très bien documenté, incluant des suggestions sur le type de représentations qu'il convient d'utiliser suivant les cas. Many Eyes comprend plus d'une douzaine d'options de rendu, depuis les graphiques sectoriels, jusqu'aux nuages de mots, en passant par les treemaps, les diagrammes relationnels, plots, ainsi que quelques cartes géographiques.

Il faudra ouvrir un compte gratuit pour mettre ses données en ligne. Le formatage est basique : pour la plupart des visualisations, les données doivent être dans un fichier texte avec séparation par tabulateurs, comportant des têtes de colonnes sur la première ligne. Les résultats offerts apparaissent bien plus sophistiqués que ce que l'on aurait pu attendre au regard des efforts déployés pour les créer. La liste de visualisations possible s'accompagne d'explications pour déterminer celles qui sont les plus appropriées suivant le contexte.

Inconvénient : vos jeux de données apparaissent publiquement sur le site Many Eyes et peuvent être facilement téléchargées, partagées, republiées et commentées par d'autres, ainsi que le projet soutenu par IBM encourage à le faire. Autre limite : la personnalisation est limitée, de même que la taille du fichier, qui ne peut pas dépasser 5 Mo.

Many Eyes, un projet soutenu par IBM
Many Eyes (cliquer ici pour agrandir l'image)

Niveau de compétences : débutants. 
Fonctionne sur les navigateurs Java et ceux pouvant afficher en Flash.
En savoir plus : sur Many Eyes

7 - Tableau Public : personnalisable et interactif

Transforme les données en diverses visualisations, simples ou plus complexes. Les champs peuvent être glissés/déplacés sur l'espace de travail et le logiciel peut alors suggérer un type de visualisation, puis personnaliser tous les éléments : étiquettes, infobulles, taille, filtres interactifs, légendes... L'un des intérêts de l'outil réside dans les différentes façons d'afficher des données interactives sur lesquelles un filtre de recherche peut agir sur de nombreux graphiques, diagrammes et cartes. Les tables sous-jacentes peuvent également être jointes. Et une fois que vous savez comment fonctionne le logiciel, le maniement de son interface « drag and drop » se fait bien plus rapidement que de coder en JavaScript ou en R. Ce qui incite à essayer davantage de scénarios avec les données. En outre, on peut facilement effectuer des calculs sur les données au sein du logiciel.

Dans cette version gratuite du logiciel de BI de Tableau Software, les données doivent résider sur le site de Tableau. La mise à jour vers la version desktop coûte environ 1 000 dollars. Par ailleurs, sans surprise, les fonctionnalités gratuites ont malgré tout un coût : le temps d'apprentissage comparé à, par exemple, Fusion Tables. Même avec l'interface drag and drop, cela prend plus d'une heure ou deux pour savoir se servir du logiciel, à moins de réaliser d'abord des graphiques simples.

Tableau comme outil de visualisation de données
Tableau Public (cliquer ici pour agrandir l'image)

Niveau de compétences : débutant avancé ou intermédiaire.
Fonctionne sur Windows 7, Vista, XP, 2003, Server 2008 et 2003.
En savoir plus : quelques vidéos de formation

8 - VIDI : des graphiques exportables en HTML

Quoi que le site VIDI le présente comme un outil pour le système de gestion de contenus Drupal, les graphiques créés par l'assistant de visualisation du site peuvent être utilisés sur n'importe quelle page HTML sans recourir à Drupal. Une fois les données en ligne, on sélectionne le type de visualisation retenu, on personnalise un peu et le graphique est prêt à être utilisé via un code embarqué auto-généré (utilisant une balise iframe, pas de JavaScript, ni de Flash).

C'est à peu près aussi facile que Many Eyes, avec davantage d'options cartographiques et sans être obligé de rendre ses données publiques. Quelques écrans fournissent rapidement des explications sur chaque type de représentation graphique et on accède à différentes couleurs de personnalisation. La taille limite des fichiers monte à 30 Mo, soit six fois plus qu'avec Many Eyes.

VIDI, source Computerworld
VIDI, source Computerworld (cliquer ici pour agrandir l'image)

Niveau de compétences : débutants.
Fonctionne avec tout navigateur web.
En savoir plus : http://www.dataviz.org/

9 - Zoho Reports : pour les analyses métiers

L'un des plus orienté « analyse métier » de sa catégorie. Zoho Reports peut récupérer les données venant de différents formats de fichiers ou directement d'une base de données et les transformer en graphiques sectoriels, tableaux et tables pivots, autant de formats familiers aux utilisateurs de tableurs.
Il présente l'intérêt de pouvoir programmer des importations de données depuis des sources provenant du web. On peut faire des requêtes sur les données en utilisant SQL et les transformer en représentations graphiques. Le service permet de faire de la publication web et du partage. Il faudra toutefois disposer d'un compte payant si plus de deux utilisateurs doivent accéder aux données. 

Inconvénient : les options de visualisation sont limitées. L'interaction de données avec le web peut être lente quelquefois. La taille des fichiers est limitée à 10 Mo.

Zoho Reports
Zoho Reports (cliquer ici pour agrandir l'image)

Niveau de compétences : débutants avancés.
Fonctionne sur tout navigateur. 
En savoir plus : http://reports.zoho.com/ZDBSampleDatabases.cc


Pour lire la 2ème partie « 22 outils gratuits pour visualiser et analyser les données »

(...)

(29/12/2011 10:34:10)

Avec Teradata, Hertz cherche à accroitre la performance de son entrepôt de données

Hertz Corporation disposait d'un entrepôt de données aux performance de moins en moins suffisantes devant l'accroissement des volumes traités et la croissance des besoins en analyse décisionnelle. Les données traitées concernent les relations clients, les opérations du parc de véhicule, la gestion du tarif et du rendement...

Dans les trente prochains mois, le loueur de voitures va progressivement déployer les solutions proposées par Teradata autour de sa plate-forme Teradata Active Enterprise. En l'occurrence, Hertz installe le nouveau Teradata 6650 ainsi que Teradata Data Warehouse Appliance exploités pour un système de test d'analyse de données. Hertz met également en oeuvre des produits Teradata à des fins de sauvegarde et restauration, le modèle de données logique pour les entreprises de voyages, qui englobent cinq produits Teradata : Decision Experts, Profiler, Professional Services, Advanced Analytics Support et Managed Services.

L'objectif est de disposer d'un datawarehouse unique capable de traiter les volumes de requêtes complexes tout en permettant les accès aux informations en temps réel. Il remplace plusieurs datamarts distincts.
(...)

(21/12/2011 10:38:55)

Big Data et BI : EMC pointe la carence des compétences

EMC s'est intéressé aux compétences en matière de Big Data et décisionnel auprès de 500 ingénieurs de la donnée (data scientist). Le constat montre une carence des compétences dans ce domaine. En effet, selon les chiffres fournis par cette enquête, seules un tiers des entreprises parviennent à s'appuyer sur des données qualifiées pour étayer leurs processus métier, accentuer leur avantage concurrentiel, améliorer leur productivité et innovation ou encore pour mieux cerner leur clientèle.

Pénurie de talents


L'étude révèle que l'explosion des données numériques, générées notamment par les capteurs mobiles, les médias sociaux, les systèmes de surveillance, les images médicales ou les réseaux électriques intelligents, provoque une croissance similaire en termes d'opportunités. La demande en «data scientists» a donc rapidement progressé ces dernières années, ce qui conduit 64% des personnes interrogées à estimer qu'au cours des cinq prochaines années, la demande de talents en sciences des données dépassera l'offre.

L'étude met par ailleurs en évidence plusieurs obstacles qui entravent le plus souvent une exploitation efficace des données, dont: des carences en compétences ou en formation (32%), le manque de budget ou de ressources (32%), une structure organisationnelle inadaptée (14%) ou encore une pénurie d'outils et de technologies (10%). En outre, seuls 22% des «data scientists» et 12% des experts de business intelligence déclarent avoir suffisamment accès aux données brutes disponibles au sein de leur entreprise pour leur permettre de les explorer à des fins de modélisation.

Data scientists et experts BI


L'étude se concentre également sur les principales différences entre le domaine de la business intelligence (BI) et la science des données (data science). Au vu du fait que la BI se concentre sur l'exploitation de données à des fins de monitoring et d'aide à la décision, alors que la science des données se concentre avant tout sur l'utilisation d'outils d'analyse et d'algorithmes afin de générer des données prospectives devant mener à l'innovation, les profils des experts de ces deux métiers sont également différents. Par exemple, note EMC, les «data scientists» sont trois fois plus nombreux à être titulaires d'une maîtrise universitaire ou d'un doctorat que les experts en BI.

ICTjournal.ch

[[page]]

Par ailleurs, alors que les experts en BI viennent en premier lieu du domaine commercial (37%), les «data scientits» proviennent plus facilement de l'informatique (24%), de l'ingénierie (17%) ou des sciences dures (11%). Ces derniers utilisent également une palette beaucoup plus diversifiée d'outils d'analyse. Ainsi, alors que de nombreux experts en BI utilisent avant tout Excel, les «data scientists » recourront beaucoup plus à SQL, aux bases de données NosQL, ainsi qu'à des outils d'analyse de big data comme Hadoop, des outils de visualisation comme Tableau, des instruments encore quasiment inconnus dans le monde de la BI. Des outils Open Source comme R statistics, Python et Perl sont également utilisés par 20% des data scientists, et seulement 5% des experts en BI.

Dans un dernier volet, EMC analyse les spécificités des spécialistes de l'analyse du big data, et note leur propension à utiliser des outils comme R Statistics (50% contre 13%), ou comme Hadoop, Greenplum ou Netezza. EMC relève par ailleurs que l'analyse du big data exige un degré élevé de collaboration avec d'autres experts, comme des statisticiens ou des programmeurs.

Au vu de la pénurie d'experts formés dans ces professions émergentes et exigeantes, EMC recommande de privilégier la formation interne de personnes dotées de rigueur et de la curiosité intellectuelle suffisante. Elle note aussi l'importance pour les entreprises de favoriser l'accès aux données afin de permettre à leurs experts de les explorer et de les exploiter à des fins d'expérimentation et de modélisation.

ICTjournal.ch

(...)

(20/12/2011 09:55:47)

Crédit Agricole unifie son outil décisionnel avec MicroStrategy

Le Crédit Agricole repose, en France, sur plus de 2 500 caisses locales regroupées en 39 caisses régionales. Il sert ainsi 24 millions de clients en France. Depuis mars 2010, le Crédit Agricole a choisi d'unifier l'ensemble de ses structures informatiques dans le cadre du projet NICE (Nouvelle Informatique Convergente et Evolutive). Il dispose ainsi de deux GIE regroupant toutes les caisses régionales : Crédit Agricole Technologies et Crédit Agricole Services.

Crédit Agricole Technologies vient de choisir l'outil décisionnel unique du groupe et qui sera désormais utilisé par 71 000 salariés dans le groupe. Il s'agit de l'offre de MicroStrategy. L'intégration de la plate-forme technique, la facilité d'utilisation et l'accessibilité autant sur le web que sur les terminaux mobiles ont été les critères du choix.

Cet outil servira notamment au reporting, les analyses et les tableaux de bord dynamiques. L'objectif est de renforcer le pilotage de la performance du groupe.

Le coût du projet n'a pas été dévoilé.

(...)

(16/12/2011 11:50:10)

IBM renforce son portefeuille dans le smarter commerce avec Emptoris

IBM a annoncé la signature d'un accord en vue d'acquérir Emptoris, un concepteur de logiciels de gestion des achats. Le montant financier de l'opération n'a pas été dévoilé, mais elle devrait être finalisée au premier trimestre 2012. Basée à Burlington dans le Massachussetts, elle comprend 725 employés et dispose de 350 clients dont ADP, Kraft et American Express. Récemment, la société a été condamnée à une amende de 7 millions de dollars contre elle pour une violation de brevets de son concurrent Ariba.

Cette opération fait suite la récente acquisition par IBM de DemandTec, pour 400 millions de dollars. Cette société a développé en mode SaaS (software as a service) des outils d'analyse des prix, du merchandising, des promotions et des actions de marketing. Les deux rachats s'inscrivent dans la stratégie d'IBM dans le smarter commerce, lancée au printemps 2011 pour aider les entreprises à optimiser leurs processus commerciaux, marketing et services aux clients.

Emptoris avait très récemment lancé la dernière version de sa suite de produits à destination des petites entreprises. Elle l'avait qualifiée de « plateforme stratégique du futur pour la gestion de la logistique ». Les apports de cette dernière version comprennent une expérience utilisateur rénovée, le support de plusieurs navigateurs, de l'iPad et l'intégration avec Microsoft Office, un module de gestion du programme, un référentiel global pour les données concernant les fournisseurs et des fonctionnalités de BI (Business Intelligence) basées sur SAP Business Object. Sur ce dernier point, on ne sait pas encore si IBM fera migrer les fonctionnalités de BI vers son offre Cognos.

(...)

(14/12/2011 14:42:13)

Base de données : SAP vise désormais la place de numéro 2

Le projet HANA, dont la paternité revient au fondateur de SAP, Hasso Plattner, et au CTO, Vishal Sikka, a été initialement présenté au milieu de l'année 2010 comme une plateforme permettant d'exécuter des charges de travail analytique beaucoup plus rapidement qu'avec les bases de données traditionnelles. Selon SAP, ce mode de fonctionnement où le système inscrit les données qu'il doit traiter en RAM, au lieu de les lire sur les disques, permet des gains en performance significatifs, voire très impressionnants.

Mais, rapidement, SAP a commencé à évoquer la capacité de HANA à gérer des charges de travail transactionnelles dans le domaine de l'ERP (Enterprise Resource Planning) et dans d'autres types d'applications, le positionnant comme une alternative éventuelle à certains produits, notamment la base de données phare d'Oracle. « C'est une opportunité très stimulante, parce qu'elle ouvre sur la possibilité de développer des applications totalement nouvelles », a déclaré Vishal Sikka à la keynote qu'il a donné à l'Influencer Summit de Boston. Sur une diapositive, il a montré la future pile logicielle basée sur HANA. À la base de la pile se trouvent HANA et les services d'infrastructure et de gestion du cycle de vie associés. Viennent ensuite les services d'applications, puis ABAP et les services de la plateforme Java, surmontés par les environnements de développement, et enfin les applications construites par SAP et celles des vendeurs tiers.

SAP bientôt numéro 2 dans les SGBD ?

SAP trace aussi d'autres perspectives, annonçant une série d'initiatives en relation avec HANA de la part de vendeurs de middleware et d'analytiques comme Tibco, du fournisseur d'ERP UFIDA, du vendeur de visualisation de données BI (business intelligence) Tableau and Jive Software, connu pour ses solutions de réseau social pour l'entreprise. « Dorénavant, SAP entend disposer d'un « écosystème tout à fait ouvert » pour HANA, » a indiqué Vishal Sikka. Cela paraît logique, bien sûr, étant donné que HANA est un produit relativement nouveau qui a beaucoup de choses à rattraper pour se mettre au niveau d'Oracle et d'autres.  Cela n'a pas empêché un autre responsable de SAP de faire une prédiction très optimiste, mardi, après la keynote de Vishal Sikka. « Retenez-ce que je vais vous dire : en 2015, nous serons le deuxième vendeur de bases de données sur le marché, » a déclaré Steve Lucas, Global General Manager Business analytics and technology. « Je sais qui nous devons dépasser. Ce ne sont pas de petits acteurs. Il va nous falloir quelques années et beaucoup d'ingénierie pour y arriver. Mais nous le ferons. »

« SAP va également chercher à conclure des partenariats avec des éditeurs de logiciels qui intégreront HANA dans leurs produits, » a ajouté Steve Lucas. Une autre bonne manière pour SAP d'avancer vers son objectif serait d'ajouter le support HANA pour son logiciel phare Business Suite, dont de nombreuses mises en oeuvre fonctionnent sur Oracle. « Ce travail est en cours, et comme aucune date d'achèvement n'a été fixée, on peut s'attendre à une mise à jour pour la conférence Sapphire de l'année prochaine, » a déclaré Sethu Meenakshisundaram, CTO adjoint de SAP. « C'est un projet de première importance et nous avançons. » SAP n'a pas encore décidé « si elle vendra aussi HANA comme base de données autonome, » a encore déclaré Vishal Sikka dans une interview.

Déjà 100 millions de dollars de vente pour HANA

« En attendant, SAP a récemment franchi une étape avec HANA, dépassant les 100 millions de dollars de ventes, » comme l'a révélé le directeur technique de SAP au cours de sa keynote. HANA est vendu sous forme d'appliance par un certain nombre de fabricants. « Les 100 millions de dollars ne prennent en compte que les revenus de licence du logiciel de SAP, » a aussi précisé Vishal  Sikka dans son interview. « Autre signe du succès de HANA, dans toutes les régions du monde, les clients ont racheté d'autres produits intégrant le système, » a ajouté le dirigeant. « CSC, l'un des leaders mondiaux dans le conseil, l'intégration de solutions d'entreprise et l'externalisation devrait adopter HANA, » a déclaré David McCue, vice-président et CIO de CSC, dans une interview. « La première instance de production concernera environ 1 téraoctet de données, mais CSC réfléchit, encore à quel type d'usage elle sera affectée, » a-t-il ajouté.

« HANA est un produit jeune, mais c'est aussi une solution viable, » a encore déclaré le CIO de CSC. « Nous sommes suffisamment confiants pour l'acheter, et nous réaliserons plusieurs mises en oeuvre pour le compte de nos clients, » a-t-il ajouté. Ce dernier a aussi donné un point de vue mesuré sur le projet à long terme envisagé par SAP pour HANA. « S'il est matériellement réalisé, le produit aura un très bon retour, » a-t-il estimé. « Sans aucun doute, HANA a montré dans sa version actuelle qu'il avait assez de ressources pour qu'on s'y intéresse. Mais comme toute prospective à long terme, celle-ci pourrait être contredite par les événements. »

[[page]]

Hier à Boston, SAP a également abordé la question de sa stratégie logicielle dans le cloud computing, récemment agitée par le rachat de SuccessFactors pour 3,4 milliards de dollars. C'est le PDG du vendeur de logiciels de gestion des ressources humaines à la demande, Lars Dalgaard, qui sera placé à tête de l'activité cloud de SAP une fois la transaction achevée. Cette acquisition intervient après plusieurs années pendant lesquelles SAP s'est employé à peaufiner précisément son approche du logiciel dans le cloud. Cela n'a pas été une mince affaire pour un éditeur comme SAP, dépendant du modèle de logiciel sur site et du flux de revenus prévisibles et lucratifs rapportés par le renouvellement perpétuel des licences et les services de maintenance. Ce concept a du être bouleversé et remplacé par un système d'abonnement, devenu le standard du cloud.

« Mais SAP a encore le temps de voir venir, et l'expérience de SuccessFactors va être un atout majeur, » a déclaré Jim Hagemann Snabe, le co-CEO, lors d'un discours liminaire. « 80% des clients importants n'ont pas fait leur choix de stratégie pour le cloud, et pensent encore en terme de cloud privé. On voit aussi que les applications de pointe sont encore confiées à des services de cloud public. » « La combinaison de nos actifs et de SuccessFactors transforme une entreprise qui a essayé de bien faire les choses... en une entreprise qui va croitre rapidement dans le monde, » a-t-il ajouté. « Nous passons aussi d'un mode défensif, à un mode offensif. »

(...)

(13/12/2011 17:14:54)

SAP s'associe à NetBase pour analyser les médias sociaux

SAP va revendre le logiciel d'analyse des médias sociaux de l'éditeur NetBase. Ce dernier fait partie d'une catégorie d'acteurs qui se développe. Sa plateforme ingère les données issues de médias sociaux, tels que Facebook et Twitter. Elle analyse ensuite ces informations pour récupérer les commentaires émis sur les produits et les marques qu'elle communique aux entreprises concernées. L'offre de NetBase est concurrente de celle de l'éditeur Radian6 qui a été acheté au début de l'année par Salesforce.com. Des fonctions de surveillance des médias sociaux existent également dans la suite de RightNow, acquise de son côté par Oracle.

Selon Byron Banks, vice président marketing pour les solutions analytiques métiers, SAP aurait pu lui-même développer ce type de technologie (*), mais s'associer avec NetBase lui permet d'entrer dans le jeu plus rapidement. Il n'a pas précisé pourquoi SAP n'avait pas plutôt racheté l'éditeur. Le logiciel sera vendu à partir de janvier comme une extension, sous le nom de SAP Social Media Analytics (by NetBase). Son prix sera basé sur le nombre d'utilisateurs et le nombre de sujets qu'une entreprise voudra suivre sur les médias sociaux, a indiqué Lisa Joy Rosner, responsable marketing de NetBase. 

30 téraoctets de données sur un an

L'application cloud de NetBase consiste en une base d'informations de 30 To, rafraîchie au fur et à mesure au rythme d'environ 90 millions de « posts » chaque jour, selon Byron Banks. Le système rassemble les « opinions » récupérées sur une année complète à travers les médias sociaux. Mais ce qui différencie vraiment NetBase des autres offres de ce type, ce sont ses capacités de traitement en langage naturel, souligne Lisa Joy Rosner. « Lorsque quelqu'un dit : « J'aime l'iPhone, il est cool », notre système comprend que « il » se rapporte à l'iPhone », donne-t-elle en exemple. NetBase peut aussi détecter différents niveaux dans l'expression, notamment la distinction qui s'exprime entre « I like iPhone » et « I adore the iPhone ». 

SAP a déterminé environ une douzaine de point d'intégration possibles avec ses autres produits, en particulier avec ses modules CRM (gestion de la relation client) et son portefeuille de solutions décisionnelles BusinessObjects BI. Pour l'instant, aucune des ces intégrations n'est disponible, mais les clients pourront accéder à une API (sous la forme d'un service web) pour les projets qu'ils souhaiteront lancer rapidement.

L'éditeur allemand compte proposer le produit NetBase au-delà des départements marketing, selon Byron Banks. Selon lui, les équipes commerciales peuvent l'utiliser pour ajuster leur stratégie de tarification et mieux comprendre les clients. Les équipes de développement produit pourraient s'en servir pour améliorer leur processus de planification. « Quelles tendances dans la mode pour le printemps prochain ? Si vous produisez en offshore, vous devez le savoir », souligne le vice-président marketing.

Dépasser la surveillance des médias sociaux

Pour l'analyste Zach Hofer-Shall, de Forrester Research, les entreprises devraient dépasser la simple surveillance des médias sociaux. Il faudrait mettre ces données dans des tableaux de bord marketing, écrit-il en citant une banque de détail ayant créé un 'index de santé des marques' qui combine le volume et les sentiments exprimés dans les conversations en ligne, les scores de ses enquêtes en ligne et les réponses recueillies par téléphone.
[[page]]
Plus encore, les entreprises devraient relier les données des médias sociaux à celles de leurs clients, afin de cibler particulièrement les clients ayant des discussions sur les sites communautaires. « Cette approche soulève des questions relatives au respect de la vie privée et présente des limites lorsqu'il s'agit d'associer les informations entre elles, mais elle a montré son efficacité pour certaines marques grand public », selon lui. Des entreprises comme Fliptop proposent des services censés faciliter cette démarche, ajoute-t-il. Fliptop permet de constituer, à partir d'une adresse e-mail, des profils incluant des informations issues de Twitter, Facebook et LinkedIn.

SAP veut aller au-delà du département marketing

Il est important de reconnaître que l'analyse des médias sociaux n'en est qu'à ses débuts, souligne de son côté Susan Etlinger, analyste chez Altimeter Group, qui a conseillé NetBase et plusieurs de ses concurrents. « C'est tellement nouveau et cela vient de partout », a-t-elle confirmé à nos confrères d'IDG News Service. C'est constitué d'un ensemble d'acteurs de différents types qui sont liés les uns aux autres ». Elle ajoute que Radian6, avec ses tableaux de bord, représente un peu l'archétype général. Tandis que des sociétés telles que NetBase et Crimson Hexagon disposent de capacités d'analyse textuelle plus avancées. 

NetBase a également constitué une base de données plus importante, ce qui lui donne un avantage sur ses rivaux, estime encore Susan Etlinger. Concernant le partenariat avec SAP, « il faudra faire des études de faisabilité », considère-t-elle. « Entre Radian6 et Salesforce.com, les structures ne sont pas si différentes, tandis que les outils de SAP et NetBase sont très différents. Il ne s'agit pas seulement de marketing, mais de développement de produits, de planification logistique, et par essence, tout endroit dans l'organisation d'une entreprise où les médias sociaux pourraient mettre les données en perspective ». 

(*) Début 2010, SAP France avait présenté un prototype d'outil destiné à l'analyse des réseaux sociaux, SNA (Social network analyser), développé par le Centre d'innovation de SAP BusinessObjects.

(...)

(13/12/2011 12:06:36)

Open Data : l'UE veut rendre les données publiques accessibles à tous

Les États membres de l'Union européenne vont avoir l'obligation de numériser toutes les données de leurs administrations publiques. En effet, selon la proposition de loi avancée par Neelie Kroes, la commissaire chargée de l'agenda numérique auprès de l'Union européenne, tous les pays membres de l'UE seront obligés de rendre leurs données publiques disponibles dans des formats numériques. Selon la Commission, « c'est une énorme opportunité pour les entreprises de haute technologie, puisque le marché a été estimé à 400 milliards d'euros par an pour l'économie européenne, dont 100 milliards d'euros reviendraient à la recherche sur les technologies de traitement des données. » De l'argent sera également alloué à la création de portails Internet via le Programme-cadre pour l'Innovation et la Compétitivité (PIC) de l'UE. La Commission va également soutenir la recherche dans le domaine des infrastructures de données.

L'objectif est de tirer le meilleur parti de la « mine d'or » d'informations cachées dont regorge l'Europe. Par données des administrations publiques, il faut comprendre toutes les informations produites, collectées ou achetées par les organismes publics de l'Union européenne. Cela pourrait inclure des données géographiques, météorologiques, statistiques, les données de projets de recherche financés par des fonds publics, ou encore les livres numérisés par les bibliothèques. « C'est un signal fort à l'attention des administrations. Elles doivent comprendre que leurs données ont plus de valeur si elles les diffusent. Elles doivent donc commencer à s'en séparer dès maintenant. Ce cadre va leur permettre de rejoindre d'autres dirigeants avisés qui tirent déjà profit des « données ouvertes ».

Des données pour favoriser la croissance

Les contribuables ont déjà payé pour cette information. Le moins que l'on puisse faire, c'est de la remettre entre les mains de ceux qui veulent l'utiliser autrement pour aider les personnes, créer des emplois et de la croissance, » a déclaré Neelie Kroes, lors du lancement de sa proposition. La Commission rendra ses propres données disponibles via un portail web Open Data actuellement en développement, et qui devrait être lancé au printemps prochain. Il servira de point d'accès unique pour les données réutilisables de toutes les institutions, organisations, agences, et autorités nationales de l'UE.

Il est probable que les premiers bénéficiaires de cette régulation seront les start-up technologiques, qui transformeront les données brutes en applications pour smartphone, comme  des cartes, des informations sur le trafic en temps réel et la météo, des comparateurs de prix, etc. En plus de distribuer toutes les informations dans un format lisible à l'aide d'un terminal, les organismes publics devront aussi s'intéresser aux applications développées en vue de la réutilisation des données. Elles devront répondre aux demandes dans des délais fixes et ne seront pas autorisées à facturer plus que le coût lié à la demande individuelle pour accéder à ces données.

Pour plus de transparence du secteur public

En pratique, cela signifie que la plupart des données seront offertes gratuitement ou quasi gratuitement, sauf si la participation aux frais de traitement est dûment justifiée. Ces conditions conviennent particulièrement bien aux entreprises qui doivent démarrer rapidement, limitées en liquidité, et aux développeurs. La Commission affirme que ces dispositions permettront également d'accroître la transparence des administrations publiques: « L'Open Data est un instrument puissant pour accroître la transparence de l'administration publique, il améliore la visibilité d'informations, auparavant inaccessibles, informe les citoyens et les entreprises sur les politiques, les dépenses publiques et les résultats. » Enfin, cette proposition s'appliquera dans le plein respect des lois concernant le traitement des données personnelles.

Un certain nombre de pays, dont le Royaume-Uni et les Pays-Bas, ont déjà créé des portails Internet sur lesquels il est possible d'avoir accès à des données ouvertes. La semaine dernière, la France a lancé un portail qui répond exactement au cadre de la proposition de la Commission. Mais d'autres États membres traînent les pieds et continuent à publier leurs données exclusivement au format papier. Si la proposition de Neelie Kroes est adoptée par le Parlement européen et les États membres, elle pourrait entrer en vigueur en 2013. Les États membres disposeront alors de 18 mois pour la transposer dans leur législation nationale.

(...)

< Les 10 documents précédentsLes 10 documents suivants >


Recherche

LMI VIDEOS et PODCASTS