Les petites cases

Comprendre le principe du Web sémantique et de RDF

Le Web sémantique est un concept développé par le W3C qui, pour faire vite, a pour but d'ajouter du sens au Web et de le rendre plus intelligent. Pour prendre un exemple simple, si je cherche dans un moteur de recherche ce site Web, je fais la requête « les petites cases ». En guise de résultat, le moteur va m'indiquer des sites qui parlent de cases à cocher par exemple. Ce qu'on appelle le bruit en recherche d'informations et qui désigne les résultats non pertinents sera conséquent1. Le principe du Web sémantique est d'ajouter une information sur mon site Web indiquant que son titre est « les petites cases », j'ajoute une métadonnée, en Dublin Core par exemple :

<meta name="DC.Title" content="Les petites cases"/>. J'insère cette balise dans l'élément head de mon document HTML. Je me rends ensuite sur un moteur de recherche généraliste intelligent2 qui connaît les spécifications de Dublin Core et je fais la requête « je cherche une page Web dont le titre contient 'les petites cases' ». Le bruit sera limité, car j'ai précisé ma requête et j'ai donné un peu de sens à ma page Web.

Il s'agit d'un exemple très simple, les principes du Web sémantique sont bien plus complexes que cela. J'utilise aussi souvent l'analogie de l'indexation : le but du Web sémantique est d'indexer le Web au moyen de métadonnées reliées entre elles pour permettre des recherches plus performantes et la mise en place d'agents intelligents permettant la récupération et l'exploitation des données. De cette façon, on crée des réseaux d'informations et par voie de conséquence de la connaissance.

Je commence à peine à voir les possibilités et j'ai l'intime conviction qu'elle représente une des pistes du Web de demain. Pour s'en convaincre, il suffit de voir l'engouement autour de la folksonomie et des micro-formats.

Je ne sais pas si vous êtes comme moi, mais j'avoue que tout cela est encore un peu confus pour moi, en particulier RDF, le langage mis au point par le W3C permettant la mise en place de cette indexation. Voici donc quelques liens en vrac et en Français pour mieux comprendre le Web sémantique et RDF :

Quelques notes en passant

1 Vous pouvez me répondre que je n'aurais pas dû choisir un nom aussi commun. C'est vrai que pour figoblog, il n'y a pas de problème ;-)

2 Je ne connais qu'un moteur de recherche proposant une recherche avancée sur les métadonnées de base du Dublin Core (auteur, titre, résumé, mots-clés), il s'agit du moteur développé par revues.org : In-extenso. Mais, il est spécialisé en sciences humaines et sociales.

3 Non, Xavier, définitivement tu n'es pas un imposteur ;-)

4 Le site de Karl Dubost, La Grange, constitue une mine d'informations inépuisable en français sur le Web sémantique et RDF

Web sémantique Indexation Geekeries — 

Commentaires

Bonjour ... je vous remerci pour votre information , c'est ma premiere visite et elle serai pas la derniere .. je vous me présente : HADJADJ AOUL Belkacem 4eme année informatique à l'université Djilali Liabes à Sidi Belabbes - Algérie .. je suis intéréssé de ce thème .. par ce qu'il va etre mon projet finale .. et j'aimerai bien que vous me donnez des informations sur ce thème ... Merci Belkacem_city13@hotmail.com