Flux RSS

Décisionnel

Si vous souhaitez recevoir toute l'information "Mot Clé" de notre feed RSS,Inscrivez-vous

609 documents trouvés, affichage des résultats 21 à 30.

< Les 10 documents précédentsLes 10 documents suivants >


(12/12/2011 12:37:34)

Cartographie : Esri lance une offre découverte de son SIG

Esri élargit l'accès à son système d'information géographique ArcView en l'ouvrant à un usage privé. Avec le programme ArcGIS for Home Use, l'éditeur assortit le téléchargement et l'utilisation « non commerciale » de la version bureautique du logiciel à une redevance annuelle de 120 euros TTC, renouvelable. L'offre s'adresse à des utilisateurs âgés d'au moins 18 ans et inclut un support de 90 jours en français, ce dernier se limitant aux problèmes d'installation du logiciel. Les utilisateurs souhaitant faire un usage commercial de l'application devront se tourner vers ArcGIS Desktop Basis, dont le prix reste fixé à 2 500 euros.

ArcGIS for Home Use concerne la version de base du produit, néanmoins « très riche », précise Gaëtan Lavenu, responsable marketing produit chez Esri France. Le droit d'usage ouvert par le programme couvre en effet huit extensions du produit : 3D Analyst (outils de visualisation avancés, d'analyse et de génération de surfaces), Data Interoperability (import/export et transformation de données), Geostatistical Analyst (outils d'exploration de données spatiales et de création de surfaces basée sur des méthodes statistiques), Network Analyst (permet de créer des itinéraires), Publisher (partage de cartes), Schematics (création de diagrammes à partir de données contenues dans la base géographique), Spatial Analyst (modélisation spatiale) et Tracking Analyst (analyse et gestion des données temporelles).

Dans une perspective professionnelle

Le logiciel pourra, par exemple, être utilisé dans un cadre pédagogique, pour réaliser des cartes permettant à un auditoire de mieux comprendre un territoire, ou pour expliquer certains phénomènes, donne en exemple Gaëtan Lavenu. L'éditeur propose par ailleurs des licences de ses logiciels dans le domaine de l'éducation.

« Dans le cadre d'activités associatives ayant un lien avec le territoire, ArcGIS pourra aussi servir à planifier des itinéraires passant par des points d'intérêt, ou des réseaux pédestres, en évaluant les pentes moyennes sur des zones montagneuses », indique encore le responsable marketing. « On peut accéder à ArcGIS online, une base de contenus très riche comprenant des données géographiques et socio-démographiques, et conserver un historique des informations ».

Pour d'autres utilisateurs, l'accès à une version moins coûteuse peut être l'occasion de découvrir ce produit aux fonctions complexes, ou d'en approfondir la connaissance qu'ils en ont, dans une perspective professionnelle, pour éventuellement postuler à d'autres fonctions.

(...)

(08/12/2011 12:33:53)

Greenplum d'EMC présente sa plateforme analytique unifiée

Greenplum, acquise par EMC l'année dernière, prévoit d'introduire UAP, plateforme analytique unifiée au 1er trimestre 2012. UAP combinera la base de données EMC Greenplum avec Greenplum HD, qui utilise le framework Hadoop, solution Open Source d'analyse pour les gros volumes de données non structurées. L'offre comprend aussi Chorus 2.0, une interface utilisateur capable de mettre en place les requêtes et la visualisation des résultats. Cette dernière version sera capable de gérer l'ensemble des données. UAP de Greenplum a été présentée hier lors d'un évènement en Californie. Les tarifs n'ont pas été dévoilés et seront divulgués l'année prochaine.

Julie Lockner, analyste chez Entreprise Strategy Groupe, estime que «  Les entreprises dans de nombreux domaines produisent des montagnes de données qui deviennent trop importantes pour les analyser avec des outils traditionnels » et d'ajouter que « le volume de données, la complexité des requêtes et le besoin de réponses rapides s'apparentent à un vrai défi ». Les entreprises, surtout celles liées au commerce ou à la santé sont très intéressées par les technologies déployées par Greenplum pour apprendre des choses sur leurs clients à partir des données existantes. Ainsi, une boutique en ligne peut corréler le comportement des visiteurs avec leurs achats ou les laboratoires pharmaceutiques pourront traiter plus rapidement les résultats d'études cliniques. Les compagnies d'assurance adopte aussi ces nouveaux outils d'analyse pour faire des prédictions plus précises.

Un des objectifs de Greenplum a été de rendre les outils d'analyses de données accessibles aux dirigeants d'entreprise et pas uniquement à une équipe d'ingénieurs spécialisés. Chorus fournit une interface moins ésotérique pour traduire en langage naturel des requêtes sur l'ensemble des données. Ce programme inclut un environnement de réseau social où les salariés peuvent collaborer sur des projets avec les données.

Extension des données analysées et volonté de formation

Michael Maxey, directeur marketing produit chez Greenplum, explique « l'UAP apporte deux avantages principaux pour les entreprises, « le premier concerne l'étendu des données prises en compte, aussi bien celles existantes dans l'entreprise que d'autres types de données. La seconde est qu'en plus d'avoir accès aux données non structurées, les fonctionnalités de Greenplum HD et Chorus 2.0 permettent de créer rapidement une « sandbox » virtuelle pour développer de nouveaux processus d'analyse ». Il ajoute que ces ajouts tirent profit des technologies VMware. Le directeur marketing produit précise que les clients pourront déployer UAP sur leurs propres infrastructures informatiques ou depuis une configuration pré-packagée. Les entreprises disposant de la base de données Greenplum ou HD peuvent intégrer cette plateforme d'analyses unifiée.

Julie Lockner constate que, dans le domaine de la visualisation des données, des éditeurs comme Tableau et Alpine Miner offrent déjà une interface accessible des données comme ce qui est disponible avec Chorus 2.0, mais les capacités offertes sur l'UAP sont assez nouvelles ». Elle rappelle aussi que l'arrivée de telles solutions va changer la formation des spécialistes des données. A cette fin, Greenplum a annoncé un programme Big Data Training qui sera enseigné auprès de 700 universités. Récemment, une conférence montrait les difficultés de trouver des compétences sur les big data. (...)

(02/12/2011 10:58:04)

Tibco Spotfire 4.0 ajoute l'axe collaboratif à l'analyse interactive

« Notre plateforme donne davantage de pouvoirs à l'utilisateur final », considère Mark Demesmaeker, directeur de la stratégie produit EMEA chez l'édieur Tibco Spotfire. L'éditeur vient de lancer la version 4.0 de sa plateforme analytique, connue pour l'étendue de ses modèles de visualisation de données et pour son aptitude à traiter en mémoire des données provenant de multiples sources. Le logiciel est désormais complètement intégré avec « Tibbr », la plateforme de collaboration sociale d'entreprise que Tibco a lancée au tout début de cette année. « On peut porter une analyse interactive sur Tibbr et la partager », explique Mark Demesmaeker. Les analyses créées avec Spotfire peuvent aussi être facilement intégrées à des portails d'entreprise ou à des blogs. « Cela fonctionne aussi avec SharePoint, de Microsoft. Dans cet environnement, il était déjà possible de le faire en recourant à une API. Désormais, l'utilisateur métier peut le faire lui-même ». A l'inverse, on peut insérer des pages web dans une analyse Spotfire, de même que des fils de discussion provenant de Tibbr.

L'objectif est d'inscrire la réflexion dans un contexte métier, en concertation avec les équipes concernées. La collaboration sociale offerte par le réseau Tibbr, ce dernier ayant été destiné dès l'origine par l'éditeur à un environnement professionnel, va permettre de créer un espace de discussion pour inviter d'autres personnes à participer à une prise de décision, au besoin par vidéoconférence. Il est aussi possible de suivre dans le temps un sujet ou l'auteur d'une analyse. Tibco explique que les utilisateurs s'appuient sur des fonctionnalités comme les signets collaboratifs pour capturer un tableau de bord dans sa configuration complète et le partager via une connexion web avec d'autres utilisateurs qui y sont abonnés.

L'offre Tibco Spotfire est principalement utilisée par de grandes entreprises, notamment dans l'industrie pharmaceutique, les télécommunications, l'énergie (pétrole, gaz...) et d'autres secteurs industriels, ainsi que dans le monde de la banque et de la finance.

Des dashboards interactifs à explorer en profondeur

La deuxième amélioration importante de Tibco Spotfire 4.0 concerne les tableaux de bord analytiques. Ces derniers fournissent maintenant une vue globale sur les paramètres clés de l'activité d'une entreprise. « Des dashboards sur lesquels on peut effectuer des drill down pour entrer dans les détails », précise Mark Demesmaeker en expliquant : « Cela combine plusieurs visualisations classiques et peut être construit par l'utilisateur. » Tibco donne l'exemple d'un de ses clients, l'opérateur néerlandais KPN qui a mis en place un tableau de bord pour surveiller l'exécution des commandes de son département vente aux grossistes. Spotfire permet de mettre en relation d'importants volumes d'informations issus de sources différentes.

Pour un manager, un cas typique d'utilisation de ces tableaux de bord pourra être de suivre l'évolution du chiffre d'affaires, par produits, clients et pays, avec des icônes et des indicateurs de couleur indiquant si les objectifs ont été réalisés, si le chiffre d'affaires progresse ou recule, son évolution sur plusieurs années... Des données que l'on peut explorer en détail. « Un manager peut donc vraiment obtenir ses chiffres-clés de cette façon ». Tibco souligne que ces « dashboards » peuvent être créés sans faire appel aux équipes informatiques. L'éditeur a par ailleurs livré une application Spotfire native pour la tablette numérique d'Apple, l'iPad, qui donne accès à des tableaux de bord interactifs. Ceux-ci sont exportables sous forme d'images ou de fichiers PDF.

Enfin, le troisième axe d'amélioration de Tibco Spotfire 4.0 concerne l'interface utilisateur, plus intuitive et plus claire. « On peut facilement cacher les éléments qui ne sont pas nécessaires et définir une mise en page spécifique pour un terminal particulier », explique Mark Demesmaker. L'annotation des rapports PDF est facilitée. Des visualisations supplémentaires sont proposées parmi lesquelles une permettant de représenter les valeurs discrètes.

Tibco Spotfire 4.0 s'intègre au réseau social Tibbr
Illustration : cliquer ici pour agrandir la capture d'écran

(...)

(02/12/2011 10:50:11)

CIO.PDF 45 : Le décisionnel 2.0 sous la contrainte de la qualité des données

Réseaux sociaux, tablettes tactiles, Cloud Computing et mobilité sont les quatre sésames des systèmes d'information en 2011. Les managers informatiques sont sous pression pour intégrer ces évolutions au coeur de leurs applications les plus anciennes. En voici des exemples clés dans ce numéro 45 de CIO.pdf.

Ainsi, le décisionnel 2.0 se heurte aux difficultés et au coût de garantir la qualité des données à exploiter. Même si les volumes de données montent en flèche avec l'arrivée des médias sociaux. Des règles et des outils spécifiques doivent donc être mis en place.

Dans ce contexte, l'intégration du DSI aux autres directions, le dialogue avec les CxO et les directions générales, sont vitaux. Nos confrères américains reviennent sur le comment d'une telle nécessité en se basant sur l'histoire du DSI de Toyota Motor Sales alors même qu'une crise majeure frappait l'entreprise.

Le dialogue CxO/CIO peut notamment viser à l'innovation. CIO.PDF 45 revient ainsi sur l'exemple de Carrefour.

Téléchargez ici CIO.PDF 45

(...)

(01/12/2011 16:31:44)

Oracle fait coexister Fusion Applications avec l'existant

Quelques semaines après l'ouverture de son cloud public annoncé sur OpenWorld 2011, Oracle a dépêché à Paris son vice-président Chris Leone, responsable de la stratégie sur les applications pour le groupe. Sa mission : présenter l'offre Fusion Applications aux clients français. Annoncée en disponibilité générale sur OpenWorld 2011, cette offre modulaire résulte de six années de réécriture et rassemble une centaine de modules qui peuvent être installés sur site, en cloud privé ou s'utiliser dans un cloud public. Les modules de gestion de la relation client (Fusion CRM) et de gestion des ressources humaines (Fusion HCM) sont disponibles sur le cloud public d'Oracle.

Ce matin, Chris Leone a rappelé la complémentarité de Fusion Applications avec les solutions d'Oracle que les entreprises ont déjà installées, notamment ses ERP (E-Business Suite, JD Edwards et PeopleSoft), mais aussi le CRM Siebel. Sur ce point, Chris Leone a été très clair. Fusion Applications ne vient pas déloger l'existant. « Nous continuons à investir dans toutes nos suites applicatives et à les faire évoluer. Continuez à les mettre à jour. Regardez ensuite dans notre offre middleware s'il n'y aurait pas une ou plusieurs briques qui pourraient vous intéresser et envisagez des opportunités de coexistence avec Fusion Applications. »

Lui-même a présenté plusieurs scénarios de coexistence, en insistant sur Fusion CRM et sur les modules de gestion des talents utilisés en mode SaaS (software as a service). Il a également évoqué l'intégration de Fusion Applications avec les solutions de gestion non Oracle, notamment via un module intermédiaire (Accounting hub). Sans oublier la dimension mobile et l'utilisation des logiciels sur tablettes.

Chris Leone a rappelé que les outils entourant Fusion Applications permettaient de configurer différents rôles d'utilisateurs dans l'entreprise. Il a également souligné la mise à disposition de modèles de processus métiers et d'une série d'outils pour personnaliser les applications à différents niveaux (données, processus, reporting, pages). 

Réseau social et BI au sein des processus métiers

A l'heure de Facebook et Chatter, Oracle n'a pas oublié d'insérer la dimension « réseau social » dans Fusion Applications. « Nous savions dès le début qu'il nous faudrait le faire », a affirmé ce matin Chris Leone. « Je peux créer des groupes et des équipes de personnes qui interagissent, avec des flux d'activité mis à jour en temps réel. Ce que nous avons voulu faire, c'est intégrer les fonctionnalités de réseau social dans les processus métiers ». De la même façon, Oracle a intégré la Business Intelligence au sein de Fusion Application, sous différentes formes : tableaux de bord, BI mobile, support à la décision, optimisation en temps réel. Dans ce domaine, Chris Leone a expliqué comment Oracle avait répliqué, dans l'offre gestion des talents, certaines fonctions BI qui avaient montré leur efficacité dans le CRM. En l'occurrence, afin de repérer les collaborateurs qui risquaient de quitter l'entreprise, l'éditeur applique aux données RH des modèles utilisés pour lutter contre l'attrition des clients. 

Le vice-président d'Oracle explique que de nombreux entreprises s'intéressent à des déploiements hybrides combinant des applications existantes installées sur site et en cloud privé, tandis que d'autres seront exploitées en cloud public. Il cite plusieurs clients (Principal Financial Group, Green Mountain Coffee, Alcoa), déjà présentés sur OpenWorld 2011, représentatifs des multiples possibilités de déploiement. Au passage, Chris Leone souligne que l'outil de réseau social d'Oracle est proposé en mode SaaS, comme un produit indépendant, et qu'il peut aussi être installé par les entreprises à l'intérieur de leur pare-feu.

Illustration : Chris Leone, VP d'Oracle, responsable de la stratégie pour les applications, sur OpenWorld 2011 (Photo Courtesy of Hartmann Studios)

(...)

(30/11/2011 10:03:50)

HP combine Autonomy et Vertica pour traiter toutes les données

Hewlett-Packard a rapidement mis à profit ses récentes acquisitions, Vertica racheté en mars dernier et Autonomy en octobre, en rassemblant ces deux logiciels dans une seule solution baptisée Next Generation Information Platform. Avec cette offre disponible fin janvier, les utilisateurs pourront rechercher et analyser des données structurées et non structurées, a expliqué Mike Lynch, ancien CEO d'Autonomy et désormais en charge de l'entité Information Optimization Business Solutions chez HP, lors de l'événement Discover 2011 à Vienne, un rendez-vous qui mêle infrastructures et solutions logicielles.

La plate-forme Vertica Analytics est un logiciel dédié au stockage et à l'analyse de très grandes quantités de données structurées, ou de données qui ont été stockées dans une base de données relationnelle. La solution Autonomy IDOL (Intelligent Data Operating couche) peut quant à elle indexer les données non structurées au sein d'une entreprise, et fournir aux utilisateurs une interface de recherche.

IDOL arrive dans sa version 10

HP propose aujourd'hui une mise à jour de la solution d'Autonomy, IDOL 10, optimisée pour les plates-formes serveurs maison Proliant, et qui inclut un ensemble de liens qui lui permettent de s'intégrer plus facilement avec Vertica. IDOL, dans sa version 10, sera disponible le 1er décembre, et offrira aux utilisateurs la possibilité de travailler avec des données structurées stockées dans la base de données Vertica. Si la force d'Autonomy repose sur ses capacités de traitement de données texte, audio et vidéo, Vertica apporte en sus les ressources d'une base de données en colonnes et des capacités analytiques.

L'interface de recherche unifiée pourrait se montrer particulièrement utile pour afficher dans un seul flux une synthèse reposant sur des données structurées et non structurées. Dans les entreprises, ces informations sont généralement traitées par des systèmes distincts. Par exemple, les informations issues de réseaux sociaux tels que Twitter, qui sont généralement capturées en tant que données non structurées, pourraient être explorées en utilisant les fonctionnalités graphiques et analytiques de Vertica. Les flux vidéo et audio qui peuvent être tous deux ingérés par IDOL, pourraient être couplés avec les données liées à des événements historiques stockés dans Vertica pour fournir un suivi en temps réel. À titre d'exemple, une banque pourrait suivre une conversation téléphonique avec un client qui demande un crédit et certains mots clefs analysés par Autonomy pourraient déclencher une alerte dans Vertica. Si lors de cette conversation, l'appelant laisse échapper quelque chose qui pourrait indiquer un risque élevé, la société de crédit pourrait être immédiatement alertée par la fonction d'analyse de Vertica, nous a expliqué un responsable de HP.




(...)

(24/11/2011 17:22:17)

Les gammes Sage 30 et 100 s'affichent sous iOS et Android

Sage veut gagner des utilisateurs au-delà de sa sphère habituelle. Dans les PME de 5 à 200 salariés, où ses gammes Sage 100 et Sage 30 ont pris leurs aises au fil des ans, l'éditeur compte en moyenne 12% d'utilisateurs, ratio classique pour une solution de gestion qui cible les fonctions comptables, commerciales et logistiques et les ressources humaines.

Avec la Génération i7 qu'il lance cette semaine, Sage vise plus large. Il propose de paramétrer des interfaces simplifiées pour des utilisateurs plus occasionnels qui accéderont uniquement aux outils et données qui leur sont utiles. Ce peut être l'annuaire des clients ou des fournisseurs, par exemple, pour retrouver une adresse, ou encore une interface de saisie de commande.

L'objectif est de rendre l'usage du logiciel aussi simple que celui d'un site de e-commerce. Cette amélioration, apportée par l'arrivée de la technologie SET sur Sage 30 et 100, permet à l'ensemble des utilisateurs d'accéder aux logiciels à partir d'une connexion web. Et de travailler ainsi à distance si nécessaire.
Sage Generation i7 sur iPhonecliquer pour agrandir l'image

L'accès aux données (catalogue produits, commandes passées, etc.) peut aussi se faire depuis un terminal mobile fonctionnant sous iOS (iPhone, iPad) ou sous Android.

Objectif : 400 000 utilisateurs d'ici 12 à 18 mois


Actuellement, Sage dénombre environ 210 000 utilisateurs de ses gammes 30 et 100 (une même base de produit déclinée suivant la profondeur fonctionnelle requise par les clients et la taille de l'entreprise). En simplifiant l'accès à cette offre, il espère passer à 400 000 utilisateurs d'ici 12 à 18 mois. A terme, il a l'ambition d'en atteindre 600 000, « compte tenu des observations faites sur d'autres marchés », souligne Hémeric de Saint-Chamas, directeur général de la division PME de Sage.

Ces deux gammes fonctionnent sur base de données propriétaire Sage, sur SQL Server ou sur SQL Express. L'utilisation d'une base Microsoft permet de disposer des « états pilotés » qui fournissent à l'entreprise les indicateurs clés de son activité, à des fins décisionnelles. Avec la Génération i7, ces états peuvent être récupérés à partir du tableur Excel, ce qui autorise les utilisateurs à les modifier (cf écran ci-dessous).
Sage Generation i7 - Etats pilotés sous Excel

Production et Gestion des affaires


Pour les utilisateurs métiers, les versions i7 s'enrichissent de deux offres complètes. D'une part, la gestion de production acquise par Sage avec le rachat d'Alcior, désormais intégrée à la gamme avec les technologies .Net. D'autre part, un module de gestion des affaires adapté aux besoins des sociétés de services. L'éditeur propose par ailleurs en standard quatre profils métiers présentant des interfaces utilisateurs type pour les fonctions de la vente, des achats, de la logistique et de la comptabilité.

Les clients existants pourront accéder aux versions i7 à partir de 500 euros HT. En complément, il existe un service de migration effectué à distance par Sage ou l'un de ses partenaires, pour environ 800 euros HT. Pour les nouveaux clients, le prix d'une licence Sage 100 Comptabilité est fixé à 1 400 euros HT et celui de la licence Sage 100 Gestion Commerciale à 2 400 euros HT.

(...)

(21/11/2011 17:26:02)

Prêt pour l'entreprise, Hadoop stimule la demande de compétences (mise à jour)

(mise à jour) Sur la conférence Hadoop World, qui s'est tenue à New York au début de ce mois, les analystes et responsables IT présents ont à plusieurs reprises souligné que l'accès à des compétences spécialisées constituerait l'une des principales difficultés des entreprises souhaitant opter pour Hadoop. Et celles qui disposeront des bonnes compétences bénéficieront d'un sérieux avantage sur les autres.

Parmi les conférenciers présents à New York, les responsables IT de la banque JP Morgan Chase et du groupe d'enchères en ligne eBay, ont profité de l'occasion pour indiquer à leur auditoire qu'ils recrutaient dans ce domaine, ont rapporté nos confrères de Computerworld. Hugh Williams, vice-président, responsable des plateformes chez eBay, a précisé que sa société recherchait des professionnels d'Hadoop et invité ceux qui étaient intéressés à s'adresser à lui. Un peu plus tard, c'est Larry Feinsmith, directeur général pour les opérations IT chez JP Morgan Chase, qui a surenchéri et proposé, en semblant ne plaisanter qu'à moitié, de payer 10% de plus qu'eBay.

« Hadoop, c'est le nouveau datawarehouse, la nouvelle source de données » au sein de l'entreprise, décrit James Kobielus, analyste de Forrester Research. On s'intéresse beaucoup aux personnes qui en savent suffisamment sur les rouages d'Hadoop pour aider les entreprises à en tirer avantage », explique-t-il.

Des compétences en datamining et en modélisation prédictive

Le framework Open Source Hadoop aide à collecter et stocker d'importants volumes de données structurées et non structurées. Les entreprises ont commencé à s'en servir de façon croissante pour analyser les petaoctets de données telles que les connexions web, clics et contenus multimédias, afin d'obtenir davantage d'informations sur leurs activités et leurs clients. Cette adoption entraîne la demande de compétences nécessaires aux analyses avancées, ajoute James Kobielus. Cela inclut les personnes ayant des connaissances en matière d'analyse statistique, de datamining, de modélisation prédictive, de traitement en langage naturel, d'analyse de contenus, de textes et de réseaux sociaux, explique-t-il.

« Les Big Data, dans leur sens large, et Hadoop en particulier, génèrent de la demande pour des gens expérimentés utilisant de nouvelles approches telles que MapReduce et le langage R, pour la modélisation statistique et prédictive », poursuit-il. « Il s'agit de personnes spécialisées dans l'analyse de données ou de scientifiques qui travailleront dans les environnements Hadoop pour pénétrer plus avant dans les données et leur donner un nouveau sens ».

Des administrateurs de clusters Hadoop

(mise à jour) L'intérêt suscité par Hadoop est aussi en train de créer une demande pour des professionnels de cette plateforme, ajoute James Kobielus. Leur rôle consistera à mettre en oeuvre des clusters Hadoop, à les sécuriser, les gérer, les optimiser et faire en sorte que le cluster reste disponible pour l'entreprise. Selon l'analyste de Forrester Research, les administrateurs de base de données qui interviennent sur Teradata ou sur l'appliance Exadata d'Oracle sont les mêmes profils qui commencent maintenant à redéfinir leurs rôles comme administrateurs de clusters Hadoop. C'est un nouveau monde qui s'ouvre, estime-t-il en ajoutant qu'on s'attend aussi à voir une demande pour les professions de la gestion de stockage et pour celles permettant d'intégrer les environnements Hadoop avec les technologies existantes de bases de données relationnelles. 

(Crédit illustration : D.R.)
[[page]]
Martin Hall, PDG de Karmasphere, fournisseur de logiciels pour les environnements Hadoop, confirme que trois catégories de professionnels sont concernées. Les professionnels de la gestion de données seront ceux qui choisiront, installeront, géreront et feront évoluer et monter en puissance les clusters Hadoop. Ce sont eux qui décideront si l'infrastructure Hadoop doit se situer dans le cloud ou sur site, quels fournisseurs il convient de choisir, quelle distribution d'Hadoop retenir. Ils définiront la taille du cluster et s'il doit être utilisé pour exploiter des applications de production ou à des fins de test qualité. Les compétences requises pour ces fonctions sont similaires à celles que l'on demande pour effectuer les mêmes tâches dans des environnements de SGBDR traditionnels ou de datawarehouses, précise Martin Hall.

Des professionnels pour construire des algorithmes MapReduce

La deuxième catégorie de professionnels sera chargée de créer les processus de traitement des données. Ils construiront les algorithmes MapReduce distribués qui seront utilisés par les personnes qui analyseront ensuite les données. Les ingénieurs possédant des compétences en Java et en C++ auront davantage d'opportunités à mesure que les entreprises commenceront à déployer Hadoop, prévoit le PDG de Karmasphere. 

La troisième catégorie de professionnels recherchés seront ceux qui disposent d'expérience sur les logiciels d'analyse statistique (SAS, SPSS), ainsi que dans les langages de programmation comme R. Ce sont eux qui généreront, analyseront, partageront et intégreront les informations rassemblées et stockées dans les environnements Hadoop.

Pour l'instant, le manque de compétences autour d'Hadoop signifie que les entreprises ont besoin d'être aidées par les fournisseurs de services pour déployer cette technologie. L'un des indicateurs de cette situation, pointe l'analyste James Kobielus, de Forrester, c'est que les revenus générés autour d'Hadoop par les professionnels du conseil et de l'intégration de systèmes sont bien plus importants que les revenus provenant des ventes des produits Hadoop. Des sociétés telles que Cloudera, MapR, Hortonworks et IBM proposent aux entreprises des formations pour qu'elles puissent elles-mêmes construire leur propre centre d'excellence Hadoop, indique-t-il.

[[page]]

En effet, même s'il subsiste des inquiétudes sur la sécurité et sur d'autres points, Hadoop est prêt à être utilisé en entreprise si l'on se réfère à l'avis de responsables IT qui sont intervenus sur la conférence Hadoop World, à New-York. Ainsi, depuis trois ans, la banque JPMorgan Chase utilise de façon croissante le framework Open Source de stockage et d'analyse de données, a expliqué Larry Feinsmith, le directeur général des opérations IT pour le groupe. La banque continue à s'appuyer fortement sur les systèmes de bases de données relationnelles pour les traitements transactionnels, mais elle utilise la technologie Hadoop pour un nombre croissant d'applications, parmi lesquelles la détection de fraude et la gestion des risques informatiques. Elle gère près de 150 petaoctets de données stockées en ligne, 30 000 bases de données et 3,5 milliards de connexions à des comptes utilisateurs. La capacité d'Hadoop à stocker d'énormes quantités de données non structurées lui permet de collecter les connexions web, les transactions et les informations recueillies sur les médias sociaux. « Nous conservons des données que nous stockions pas auparavant », a pointé Larry Feinsmith. Celles-ci sont agrégées sur une plateforme commune afin d'être explorées, pour mieux comprendre les clients, avec un ensemble d'outils de datamining et d'analyse.

eBay stocke 9 Po de données sur des clusters Hadoop et Teradata

De son côté, le groupe eBay utilise la technologie Hadoop et Hbase, qui supporte l'analyse en temps réel des données, afin de constituer un moteur de recherche pour son site d'enchères en ligne. Hugh Williams, vice-président, responsable plateformes et recherche chez eBay, a expliqué que ce projet de moteur (nom de code Cassini) va remplacer la technologie dont la société s'est servie depuis le début des années 2000. La mise à jour est notamment nécessaire pour prendre en charge les volumes croissants de données. eBay rassemble plus de 97 millions d'acheteurs et de vendeurs actifs et plus de 200 millions d'articles en vente dans 50 000 catégories. Il gère 2 milliards de pages vues, 250 millions de requêtes et 10 millions d'appels à des bases de données chaque jour, a indiqué Hugh Williams. Le groupe stocke 9 petaoctets de données sur des clusters Hadoop et Teradata, un volume qui grossit vite, a ajouté le responsable plateforme et recherche. Il précise que 100 ingénieurs d'eBay travaillent sur le projet Cassini, ce qui en fait l'un des plus gros efforts de développement de la société.

Le moteur, prévu pour entrer en fonction l'an prochain, devra répondre aux requêtes des utilisateurs en fournissant des résultats contextuels et plus affinés que ceux que propose l'actuel système, promet Hugh Williams. 

Larry Feinsmith, de JP Morgan Chase, met en garde les départements informatiques qui seraient intéressés par Hadoop. Ils doivent être vigilants sur les questions de sécurité. Il explique que l'agrégation et le stockage des données provenant de sources multiples peut créer de nombreux problèmes liés au contrôle d'accès et à la gestion des données, tout en faisant remonter des questions liées à la possession des données.

(...)

(16/11/2011 10:02:46)

L'AEFE optimise le reporting de ses données avec Talend et Actuate

L'agence pour l'enseignement français à l'étranger (AEFE) gère 480 écoles, collèges et lycées établis hors de France, dans 130 pays, qui proposent un enseignement conforme à l'exigence des programmes de l'Éducation nationale française. Ces établissements, de la maternelle aux classes préparatoires, accueillent 300 000 élèves, dont 110 000 enfants d'expatriés français et 190 000 nationaux et étrangers tiers désirant bénéficier d'un enseignement du type de celui des écoles françaises. L'AEFE fonctionne avec 6 400 titulaires de l'Éducation nationale et 15 000 collaborateurs recrutés localement mais est rattachée au Ministère des Affaires Etrangères.

Les gestionnaires de l'agence utilisaient, pour le pilotage et les rapports, Microsoft Excel pour traiter des extractions brutes à partir des systèmes informatiques de production. De fait, les équipes informatiques étaient donc sollicitées pour effectuer régulièrement de telles requêtes, chaque décideur ayant ses propres exigences. Afin de développer l'autonomie des 100 à 150 décideurs concernés et, partant, leur réactivité, l'AEFE a décidé de déployer un véritable système décisionnel.

Une optimisation des reportings

Talend extrait les données de six systèmes : le SIRH, la paye du siège (système distinct du SIRH), la gestion des bourses scolaires, la comptabilité et le budget et la gestion de la formation continue. Les données sont stockées dans un infocentre puis un datawarehouse sous PostgreSQL. Enfin, les solutions d'Actuate sont sollicitées pour créer un cube, des cubeviews, des rapports, des générations de feuilles Excel (certains utilisateurs souhaitant conserver un traitement de ce type) et enfin un tableau de bord synthétique.

« Bien qu'il y ait peu d'indicateurs et une faible volumétrie, nous devions faire de très nombreux croisements de données et nous avions besoin de fluidité et de réactivité » souligne Maryam Khiali, chef de projet maitrise d'oeuvre pour le système d'information décisionnel (SID) de l'AEFE. Avec la solution implémentée, les utilisateurs peuvent aisément fabriquer des rapports à partir des cubeviews, la navigation au sein des données disponibles empruntant une logique d'explorateur de fichiers.

Le projet a été mené à partir de janvier 2011. Il a notamment permis à la directrice de l'AEFE de disposer d'un rapport avec les chiffres dont elle avait besoin pour une audition au Sénat en moins d'une demi-heure contre de nombreuses heures auparavant.

(...)

< Les 10 documents précédentsLes 10 documents suivants >


Recherche

LMI VIDEOS et PODCASTS