Dossier
Le Web sémantique, un vaste terrain d'applications encore à défricher


Le Web sémantique, un vaste terrain d'applications encore à défricher
Le Web sémantique, un vaste terrain d'applications encore à défricher
(20/02/2007) - par
Cyrille Chausson
Alors que le Web 2.0 initie les internautes à un nouveau modèle de contenu, de services et d'applications en ligne, le Web sémantique, vaste projet démarré en 1999 par le W3C, pourrait en révolutionner la perception. Son concept : structurer par des mots-clés ainsi que des annotations (meta-données) chaque donnée afin d'en extraire un champ sémantique et de les relier logiquement entre elles. Soit, plus concrètement, traduire la connaissance ainsi que la logique en langage informatique, capable d'être compris par une machine. Fi des pages web, bienvenu dans un monde d'automatisation de la représentation de la connaissance et des données intelligentes.
Techniquement, la structure de base du Web sémantique repose sur une combinaison de principes, eux-mêmes convertis en termes informatiques.
A la base, le XML qui fournit la grammaire générale au processus. Les annotations des données et les méta-données, traduites en RDF (RDF (Resources Description Framework), forment la couche du dessus, qui, grosso modo, décrit les ressources. Enfin, enveloppe logique qui englobe la couche précédente, l'ontologie, qui, schématiquement, décrit les descriptions. L'ontologie est représentée par le langage OWL (Web Ontology Langage - voir également "Owl, solution pour le Web sémantique") qui "permet d'ajouter des contraintes logiques qualifiantes", précise Xavier Lacot, consultant en architecture technique chez Clever Age. Ces trois langages forment l'ossature de base. Restent enfin SKOS (Simple Knowledge Organisation System) et Topic Maps qui de leur côté regroupent un ensemble de langages et de bonnes pratiques destinés à simplifier la représentation de thésaurus (qui hiérarchise les vocabulaires spécialisés et délivre des informations connexes) et vocabulaires (ensemble de termes définissant un sujet), dans un environnement de Web sémantique.
Du web aux services sémantiques
Le Web sémantique et ses technologies "transformeront toutes les données du monde en une gigantesque base de données", raconte Tim Berners-Lee dans son livre "Weaving the web" publié en 1999. Aujourd'hui, sept après sa conceptualisation, le Web sémantique ne trouve d'applications que dans quelques services en ligne, souvent étiquetés Web 2.0. C'est notamment le cas des réseaux sociaux, qui par le truchement d'ajout aux pages HTML de quelques balises dites "sémantiques", également baptisées microformats (voir l'article sur l'état des technologies en vigueur), parviennent à automatiser les relations entre individus. Ou encore dans les systèmes de "Tags Clouds", qui autorisent l'internaute d'ajouter des mots-clés à ses photos, par exemple, afin d'en faciliter l'accès et l'indexation. Autre exemple, plus axé autour du Web participatif, le wiki sémantique (Le sémantique Wiki expliqué sur Wikipédia), qui donne la possibilité aux internautes d'ajouter des mots-clés et des méta-données aux pages créées par le système de wiki. Et enrichir ainsi l'information et son indexation.
Plus transparent pour l'utilisateur, le principe des bureaux sémantiques, encore au stade expérimental, s'appuie sur un transfert des technologies du Web sémantique, au poste de travail. Leur but : "s'inspirer des SOA en fournissant des prototypes de services sémantiques via des API", commente Stéphane Laurière en charge du projet Nepomuk chez Mandriva. Calendrier, gestion d'agenda, stockage, annotations, indexation et surveillance automatique font partie de l'attirail de services fourni par Nepomuk, projet de desktop sémantique social. "Il s'agit de faire communiquer des outils venant d'autres technologies, par le biais de plug-in. Et cela en tâche de fond." Le système s'adosse à une ontologie basée sur PIM (Personal Information Management - application de gestion d'informations personnelles, utilisée notamment dans Outlook). L'idée est de "fournir un extracteur qui convertit les données au format de cette ontologie", précise Stéphane Laurière.
L'ontologie pour décrire les processus métiers
Côté entreprise, le champ d'application des technologies qui entourent le Web sémantique demeure, quant à lui, réduit. Encore boudé par les décideurs (voir l'avis d'expert). "Certains éditeurs, spécialisés dans la manipulation de thésaurus et de bases de connaissances, se sont lancés sur le créneau, mais leurs solutions sont encore marginales, et paradoxalement peu orientées Web", commente Xavier Lacot.
Reposant sur un écosystème d'outils de développement semblable à une peau de chagrin, les principes, tels que les ontologies, de l'approche sémantique, sont encore mal perçu par les entreprises. "Dans certains cas, le recours aux ontologies dans une système de gestion de la connaissance est pourtant évident", reconnaît Bernard Vatan, consultant en représentation de la connaissance chez Mondeca, société française qui développe ITM, une plate-forme sémantique complète. "Le développement d'une ontologie reste dédié aux entreprises manipulant de gros volume de données, et agit dans ce cas précis comme un fédérateur d'informations, affirme Bernard Vatant. L'ontologie formalise ici leur business, leur processus métier, en décrivant des règles logiques". En gros, il s'agit de se dédouaner d'un système reposant sur une hiérarchisation mécanique de type base de données, pour adopter un système basé sur l'automatisation de la connaissance. Techniquement, assure Bernard Vatan, "il n'y a pas de limite de croissance avec l'ontologie, contrairement aux bases de données. Le serveur d'ontologie devient une couche supplémentaire, connecté par de multiples API. Sa force est qu'il fédère l'information sans la détruire". Par exemple, chez Mondeca, la plate-forme sémantique tisse automatiquement des liens logiques entre des données et des documents de sources hétérogènes, pour en extraire une arborescence de la connaissance. Et pour cela, elle s'appuie sur une ontologie qui décrit les processus métiers, propre à l'entreprise. Bénéfice: gain de temps grâce à une recherche d'informations ultra-contextualisée côté utilisateurs, et enfin, gestion automatisée du savoir pour l'ensemble de l'entreprise, à chaque nouvelle entrée.
Quels freins?
La faiblesse des ressources en développement n'est pas la seule raison de la lente adoption des technologies liées au Web sémantique par les entreprises. Outre des temps de développements très importants, Bernard Vatan pointe également du doigt le manque de collaboration entre développeurs d'ontologie, pourtant un des fondamentaux à l'origine du Web sémantique. "Dans la pratique, peu d'entreprises aiment à partager et diffuser leurs développements d'ontologies. Les risques peuvent paraître minces sur la totalité du marché, mais repositionné par secteur, l'ontologie peut devenir une arme concurrentielle", explique en substance Bernard Vatan. Et d'ajouter: "Aussi matures que soient les outils, les entreprises se heurtent avant tout à un manque de compétence, qui cantonne les applications sémantiques aux mains d'experts, alors peu nombreux, ainsi qu'à une courbe d'apprentissage raide". En attendant, Bernard Vatan conclut: "il y a des gens qui ont de grandes visions pour le Web sémantique. Dans la pratique, son application reste restreinte, limitée principalement aux applications universitaires". Bien loin du pharaonique concept d'une base de données géante mentionné par Tim Berners-Lee.