Les petites cases

Réflexions autour du Web sémantique

Depuis quelques mois, il existe un intérêt grandissant autour du Web sémantique, certains y voient même le « Web 3.0 ». D'ailleurs, étant abonné au fil RSS de la requête « Web sémantique » sur le système de recherche dans les blogs de Google, j'ai pu constater que la question du Web sémantique revenait régulièrement plus ou moins bien traitée (souvent moins que plus, malheureusement...) dans les billets-prédictions pour la nouvelle année. Je me garderais bien d'en faire autant, je ne sais pas si le Web sémantique s'imposera en 2007 et, à vrai dire, cela m'importe peu. Ce dont je suis sûr, en revanche, c'est que les concepts, les standards, les technologies et les applications relevant du Web sémantique constituent des réponses intéressantes, mais peut-être pas uniques, pour conserver, organiser, manipuler et traiter l'information dans le contexte actuel d'explosion, dont je parlais dans mon précédent billet.

Cet intérêt grandissant du « grand public » pour le Web sémantique a provoqué chez ses « supporters » anglo-saxons une vague de réflexions visant à dresser un bilan des dernières années, réfléchir à ce que peut être le Web sémantique de demain et comment le promouvoir. Je regrette un peu qu'une réflexion équivalente ne s'engage pas véritablement dans la monde francophone, à l'exception de Simon qui, dans un billet, se pose la question de savoir comment faire la promotion du Web sémantique, relayant cette question posée par certains spécialistes du Web sémantique lors de ISWC 20061, il faut bien avouer que c'est le désert. Peut-être que le fait que peu d'universitaires français ou de chercheurs dans des services de R&D bloguent explique en partie cette absence dans la blogosphère, mais cela n'explique pas tout. Je vous propose donc de faire le point sur ces différentes réflexions, pour, je l'espère, les poursuivre dans nos différents blogs, listes de discussions et autres.

Commençons par les billets en forme de bilan. Un peu avant l'été, Tim Berners-Lee, Nigel Shadbolt et Wendy Hall proposaient un bilan des actions depuis 1999 et, à partir de là, reprécisaient la vision du Web sémantique dans l'article Web semantic revisited. Plus récemment, Jim Hendler proposait une communication dont les termes me semblent fondamentaux : The dark side of the semantic Web. Jim Hendler est professeur en Intelligence artificielle et un des co-auteurs avec Tim Berners-Lee et Ora Lassila de l'article fondateur du Web sémantique écrit en 1999. Cette communication est un véritable Mea culpa de la part de Jim Hendler et pourrait marquer une vraie rupture dans la vision du Web sémantique dans la continuité de l'article de TBL, Nigel Shadbolt et Wendy Hall. En effet, il avoue que la tournure prise à l'heure actuelle par les technologies du Web sémantique correspond à la vision originale de Tim Berners-Lee et que l'introduction des technologies issues de l'intelligence artificielle comme les ontologies constituait une erreur. Il pense ainsi qu'« un peu de sémantique » pourrait largement suffire à améliorer les choses. Il précise d'ailleurs sa réflexion dans un autre billet : Tales from the Dark side – continued, en appelant, entre autres, à tirer les conclusions du succès du Web 2.0. Il met en garde dans un dernier billet à une lecture excessive de sa réflexion, un peu de sémantique ne signifie pas aucune sémantique. Parmi les nombreuses réactions aux billets de Jim Hendler, je retiendrais celle de Stefano Mazzochi, inventeur du framework cocoon et dévelopeur au sein du projet SIMILE du MIT. Dans son billet, Darkness is relative, I guess, il applaudit les propositions de Jim Hendler et les met en relation avec ces propres réflexions. Comme d'habitude avec Stefano, les propos sont mesurés et réfléchis et se posent en dehors de toutes polémiques stériles.

Alors que Jim Hendler pose la réflexion sur l'essence même du Web sémantique, d'autres dressent le bilan au niveau des applications. En expliquant comment mettre en place une application sur le Web utilisant RDF, Lee Feigenbaum, chercheur chez IBM, propose un panorama en deux billets des différents logiciels et applications pour manipuler du RDF sur le Web : Using RDF on the Web : a survey et Using RDF on the Web : a vision et montre la maturité de ces applications, à mettre en corrélation avec la liste des 353 outils du Web sémantique, citée par Christian, au mois d'octobre et remise à jour régulièrement.

Le même Lee Feigenbaum, après avoir rejoint le SWEO (Semantic Web Education and Outreach Interest Group) au sein du W3C, a proposé un billet sur la vision du Web sémantique en entreprise à partir de l'expérience de son groupe de travail au sein d'IBM : Semantic Web technologies in the enterprise. Il démontre l'intérêt d'IBM pour ce domaine qui offre un moyen de standardisation des données et une plus grande flexibilité.

Pour finir dans les réflexions prospectives, je finirai avec ce très intéressant article de Nova Spivack : Minding the planet : the Meaning and future of the Semantic Web. Il incite à dépasser la vision initiale du Web sémantique, c'est à dire un moyen de rendre plus intelligent le dialogue entre les machines, et y voit plutôt un moyen de rendre intelligent le Web dans son ensemble et ainsi de profiter aussi bien aux machines, mais aussi aux utilisateurs. Harry Chen en a tiré un compte-rendu très intéressant si vous ne souhaitez pas tout lire.

Quelles conclusions peut-on tirer de toutes ces réflexions ? Il semble bien que la vision initiale de Tim Berners-Lee a évolué de manière sensible au cours de cette dernière année. Le Web sémantique s'éloigne des seules machines, pour se rapprocher des utilisateurs. Plus simple, plus accessible et aussi plus proche des technologies traditionnelles du Web, comme le démontrent les microformats et les standards GRDDL et RDF/A, le Web sémantique rencontre peu à peu les besoins des utilisateurs et leurs usages issues des applications du Web 2.0. Il s'éloigne de la vision de l'intelligence artificielle avec les ontologies à la base du modèle pour se concentrer sur les données avec le phénomène de la folksonomie2, par exemple. Bref, l'appropriation est en marche et le Web sémantique, chimère inaccessible, il y a encore peu, pourrait devenir l'enjeu de demain et une réponse aux problèmes de croissance que vit le Web, en ce moment.

Quelques notes en passant

1 Je vous renvoie donc au billet de Simon sur la question de la promotion et je vous invite si la question vous intéresse à en débattre sur la liste Web sémantique FR.

2 Au passage, je vous signale la refonte complète du site sur SKOS au W3C, plus pratique, plus accessible et très complet.

Management de l'information Web sémantique Causeries Indexation — 

Commentaires

Pour information : j'avais dans mes réserves la référence de ce document : Sinclair, P., Lewis, P., Martinez, K., Addis, M. and Prideaux, D. (2006) Semantic Web Integration of Cultural Heritage Sources (Poster). In Proceedings of 15th World Wide Web Conference, Edinburgh, Scotland. http://eprints.ecs.soton.ac.uk/12351/ Stéphane.
> Certains y voint même le "Web 3" 3, en forme de clin d'oeil aux triplets RDF, qui sait ;-) Merci pour cette synthèse, Got. Quand je pense qu'au moment où les choses commencent à remuer sérieusement, Karl D. abandonne son si beau carnet...
Merci Stéphane pour cette référence, je vais lire cela attentivement. Il parle du CIDOC-CRM à propos duquel il faudrait que je fasse un billet à l'occasion.
Merci Gral. Nous serons beaucoup à la regretter et, comme Karl passe de temps en temps par ici, je voudrais le remercier pour ces feuilles qu'il faisait tomber sur le chemin non tracé, afin de nous y guider (désolé, je ne suis pas aussi bon poète que toi...)
oué c bien cool le web sém