Dossier

Le Web sémantique, un vaste terrain d'applications encore à défricher

imprimerenvoyerrecevoir

Le Web sémantique, un vaste terrain d'applications encore à défricher

Après-coup : précisions de Bernard Vatant, Mondeca


(20/02/2007) - par Olivier Rafal

Cité dans le dossier, Bernard Vatant, de Mondeca, a souhaité apporté des éclaircissements. Nous publions ici son courrier.


"Un certain nombre de propos qui me sont attribués dans votre dossier sur le Web sémantique en date du 20/02/2007, par ailleurs de grande qualité, nécessitent clarification. Si j'en juge par les retours que j'en ai eus, les propos rapportés semblent contribuer à véhiculer une vision globalement assez négative de l'état de ces technologies et de leur adoption par le marché, vision qu'il ne me semble pas avoir voulu transmettre lors de l'entretien dont ces propos ont été extraits.

Tout d'abord le dossier ne parvient pas à éviter l'amalgame entre d'une part la "vision" originale du "Semantic Web" de Tim Berners-Lee, où le savoir de tous sur tout deviendrait interopérable grâce à la sémantique commune permise par les langages RDF, et l'application des mêmes technologies et langages sémantiques dans les mondes plus clos que sont les systèmes d'information d'entreprise, les portails de communauté, les administrations, ou les grands centres de documentation. On est en droit pour toutes sortes de raisons tant techniques que sociales, d'être sceptique sur le réalisme de la vision de Tim Berners-Lee, j'ai pu exprimer un tel scepticisme lors de l'entretien, et dans ce cas ma remarque sur le caractère encore "essentiellement universitaire" du Web sémantique est à lire uniquement dans ce sens-là.

Par contre, et c'est le point essentiel que je voudrais clarifier, l'adoption par des entreprises majeures des *technologies et langages sémantiques* est une réalité que nous vivons quotidiennement à Mondeca, et ce depuis plusieurs années, et nos clients sont là pour en témoigner. Les solutions mises en place pour des domaines aussi variés que l'automobile, la presse, l'édition juridique ou le tourisme, montrent la capacité de ces technologies à dépasser les limites et contraintes des solutions utilisant des bases de données classiques, et leur capacité opérationnelle en vraie grandeur dans des environnements de production exigeants en termes de complexité, de performance et de volume de données. Le fait même que les entreprises soient réticentes à partager leurs ontologies, présenté comme un frein dans le dossier, est de fait un signe plutôt positif montrant que les entreprises comprennent que leur vocabulaire métier et sa structuration sémantique est une richesse à exploiter de façon stratégique, richesse sans doute plus précieuse que les données elles-même que ces ontologies permettent de structurer. En bref, la pénétration de ces technologies dans la réalité de l'entreprise est bel et bien en marche.

Par ailleurs, et c'est là aussi un point important, la famille des langages sémantiques est nombreuse, et ses membres (RDF, RDFS, OWL, SKOS... ) sont souvent vus à tort comme concurrents. En fait la niche de chacun de ces langages devait se clarifier et cette clarification est maintenant bien avancée. A cet égard les applications d'entreprise sont un excellent terrain de test, et permettent aujourd'hui une vision claire de la place de chacun des composants dans des architectures où ils doivent être vus comme complémentaires.

Un autre point capital qu'il me semblait avoir abordé lors de l'entretien mais qui n'apparaît pas dans le dossier et je le regrette, c'est que la mise en place de technologies sémantiques au sein de l'entreprise nécessite un décloisonnement des "silos" traditionnels du savoir, en obligeant tous les acteurs du système d'information à parler le même langage, et donc à expliciter la sémantique de leurs jargons respectifs, à mettre à plat les accords ou désaccords implicites, les approximations et les incohérences, les modes de pensée et de traitement de l'information etc. Cet "audit conceptuel" des données et du langage est parfois douloureux mais toujours bénéfique, il est incontournable pour la transition vers les systèmes sémantiques, mais en même temps ces mêmes systèmes aident à sa réalisation. Nous avons de nombreux retours clients du caractère "gagnant-gagnant" de ce processus.

Enfin, en ce qui concerne le Web sémantique proprement dit, il est à noter que de plus en plus de données structurées et libres d'utilisation sont publiés sur le Web par des entreprises, des centres de recherche, des organismes publics, des communautés territoriales ou d'intérêt, souvent par l'intermédiaire de plate-formes collaboratives de type Wiki. Que ces données emploient ou non explicitement les formats "officiels" de la famille RDF, la sémantique explicite ou implicite gouvernant ces données structurées contribue à la "sémantisation" progressive du Web.
De telles données sont pour ainsi dire "pré-mâchées" pour des applications qui peuvent facilement les migrer au format RDF et les rendre accessibles par Web Services. Voir par exemple les projets Geonames (http://www.geonames.org/ontology/) pour les données géographiques, ou dbpedia (http://dbpedia.org/docs/) pour les données structurées issues de Wikipedia."





CONFERENCES
23/03/2010
CLOUD COMPUTING
De 8h30 - 14h00 à l'Automobile Club de France - Paris 8e
PARTNER ZONE
LIVRES BLANCS
Les principes de la virtualisation du stockage 20 mars 2010 - 3PAR
Les principes de la virtualisation du stockage
Peter Williamson, de Bloor Research, explique les principes de la virtualisation du stockage et met en garde contre les principaux pièges à éviter. Dans (...)