Dossier

Le Web sémantique, un vaste terrain d'applications encore à défricher

imprimerenvoyerrecevoir

Le Web sémantique, un vaste terrain d'applications encore à défricher

Owl, solution pour le Web sémantique


(20/02/2007) - par Gérard Canesi

Recommandé par le W3C, Owl trouve ses débouchés pour des logiciels de recherche intelligente sur le Web grâce aux ontologies.


Aujourd'hui le Web est constitué de suites de pages Web liées les unes aux autres sous forme arborescente ; les moteurs de recherche se contentent de trouver les mots clés à l'intérieur de ces pages. A l'opposé, le Web sémantique vise à atteindre un Web "intelligent", où des méta-données et informations relationnelles structurées (dits aussi inférences ou prédicats) seraient utilisables par des logiciels de recherche d'information. Le W3C a recommandé deux technologies pour le Web sémantique il y a tout juste un an : RDF (Resource Description Framework) pour la spécification, la syntaxe de description des ressources et informations et Owl (Web Ontology Language), un format de XML avec spécifications pour écrire des ontologies Web (les interrelations entre les meta-données).
Les méta-données permettent de réaliser des recherches grâce à un thésaurus qui met en correspondance certains mots ou listes de mots. Néanmoins ces recherches sont limitées et binaires : l'absence d'occurrence du mot rime souvent avec réponse vide ou farfelue. C'est là qu'Owl intervient. Un exemple permettra de comprendre plus facilement le principe : au premier niveau une page Web comporte les méta-données produit = 'joint' et matériau = 'caoutchouc' ; au deuxième niveau on crée les inférences sous forme de triplets attribut-relation-attribut : caoutchouc est fabriqué avec latex ; latex provient d'hévéa ; hévéa trouvé en Sierra Leone. Owl permettra au logiciel de recherche de retrouver les liens entre toutes les informations grâce à des ontologies s'appuyant sur les inférences des différentes pages. Cette technologie autorise la recherche et la remontée d'informations sur les joints ou le caoutchouc dans des pages traitant d'autres termes définis dans les inférences. Les relations d'équivalence, d'inégalité ou de négation sont utilisées. Owl autorise les relations de symétrie (si l'hévéa est trouvé en Sierra Léone, alors en Sierra Leone on trouve des hévéas) et la transitivité (si le latex provient de l'hévéa et l'hévéa se trouve en Sierra Leone alors le latex provient de Sierra Leone). Une technique qui rappelle les prédicats et les règles relationnelles utilisés en intelligence artificielle.

Rechercher dans de grandes quantités d'informations

Owl intéressera donc les éditeurs d'outils de recherche d'information, les sociétés spécialisées en veille, mais aussi, dès que ces agents nouveaux seront en production, tous les concepteurs de sites Internet sous peine de ne plus être référencés. Côté utilisateur final, toutes les industries qui disposent de vastes quantités de données stockées sous forme de documents texte, images, sonores, vidéos, sont intéressés par des correspondances entre fichiers associés à un même produit avec des recherches non intrusives. Pour Paul Vivant, directeur de Digimind, une SSII française spécialisée dans la veille stratégique, « le langage Owl est mature quoiqu'encore assez peu utilisé mais le phénomène devrait prendre de l'ampleur petit à petit, du fait de la recommandation du W3C ». Et Paul Vivant, d'ajouter : « Owl fonctionne réellement : la prochaine version du logiciel de veille de Digimind utilisera Owl et les ontologies ». A faire taire les mauvaises langues qui jugent Owl trop verbeux, entouré de termes très techniques et conceptuels ; bref , trop sémantique !





CONFERENCES
23/03/2010
CLOUD COMPUTING
De 8h30 - 14h00 à l'Automobile Club de France - Paris 8e
PARTNER ZONE
LIVRES BLANCS
Les principes de la virtualisation du stockage 20 mars 2010 - 3PAR
Les principes de la virtualisation du stockage
Peter Williamson, de Bloor Research, explique les principes de la virtualisation du stockage et met en garde contre les principaux pièges à éviter. Dans (...)