Les petites cases

RDFaiser votre blog, 3ème partie : l’exploitation

Si HTML permet de structurer une page Web dans une visée documentaire, RDFa permet d’en structurer, de manière indépendante, les données. Au final, RDFa ajoute donc une troisième couche aux deux existantes :

  • HTML pour structurer la page Web ;
  • CSS pour structurer la mise en forme de la page Web ;
  • RDFa pour structurer les données de la page Web.

Il est difficile de prévoir aujourd’hui tous les usages possibles de RDFa ; ils restent encore largement à inventer. En effet, et c’est le propre et l’intérêt des technologies du Web sémantique, la modélisation des données en RDF est indépendante des usages qui en sont faits. Malgré tout, il est d’ors et déjà possible d’identifier quelques usages.

Exploitation des données en RDFa par les moteurs de recherche

Le premier d’entre eux a fait couler beaucoup d’encres électroniques ces derniers temps. Yahoo a annoncé le support de certaines technologies du Web sémantique, dont RDFa. Dans ce cadre, les données en RDFa indexées par le moteur de recherche vont améliorer les interfaces de réponse, en renseignant mieux l’internaute. J’espère pouvoir revenir sur les possibilités ouvertes par ce support intégré à la toute nouvelle plate-forme Yahoo SearchMonkey.

De même, on peut imaginer que Yahoo se servira de la structuration des données pour améliorer la pertinence des résultats, en associant des poids différents en fonction de la propriété RDF utilisée et en exploitant le typage des liens rendu possible par RDFa.

Ajouter des fonctionnalités au navigateur

A l’image des expériences menées avec les microformats, les données en RDFa peuvent être exploitées pour ajouter des fonctionnalités aux navigateurs. Ainsi, l’extension pour Firefox, Operator, créé à la base pour les microformats, propose un support de RDFa. Il est ainsi possible de créer des scripts déclenchant des actions en exploitant les données en RDFa contenues dans la page Web. Si cela vous intéresse, j’avais mis au point quelques exemples très simples avec la précédente version.

Dans la même veine qu’Operator, il me semble tout à fait possible d’exploiter les données en RDFa avec un script Greasemonkey. A ma connaissance, il n’existe pas d’exemples, mais il serait par exemple assez simple d’adapter ce script permettant d’afficher la licence « Creative commons » de la page Web qui serait exprimé en RDFa. Il existe une multitude de possibilités et je suis sûr que votre imagination et votre science de la programmation en javascript (bien meilleure que la mienne ;-) ) pourront faire des merveilles. Les possibilités du couple Greasemonkey-RDFa relèvent, d’ailleurs, tout autant de l’usage suivant.

Agrémenter et améliorer l’expérience de navigation des internautes

En effet, dans le même ordre d’idée, plutôt que d’ajouter des fonctionnalités aux navigateurs en lui-même, il est possible d’agrémenter la navigation dans la page avec des comportements dans la page Web et/ou en proposant des informations complémentaires à partir de l’exploitation des données en RDFa.

Fuzzbot, par exemple, est une extension Firefox qui exploitent les informations en RDFa et les affichent de manière formatée à l’utilisateur. Par exemple, il est possible aujourd’hui d’afficher la photo d’une personne renseignée avec la propriété foaf:depiction.

Cela ressemble un peu à l’exemple de l’affichage de l’avatar d’un commentateur que j’avais mis au point pour ce blog et on pourrait par exemple envisager dans le cadre d’une page contenant des données en SIOC afficher les URL vers les autres commentaires effectuées par le même utilisateur sur le même blog voire sur un autre blog en interrogeant Sindice.

Enfin, à l’image du système des SmartLinks mis au point par AdaptiveBlue, il est aussi possible d’afficher des informations complémentaires d’un livre référencé par Dbpedia ou d’une chanson, d’un album ou d’un artiste référencé dans la base de Music Brainz en RDF mis au point par Yves Raymond. Dans ce cas, plutôt que d’ajouter des attributs spécifiques à Adaptive Blue qui ne sont absolument pas standards (<a bluelink="yes" bluekey="" asin="" href=""></a>, no comment !), vous ajouterez des données en RDFa qui pourront non seulement être utilisées par ce système, mais pourront être exploitées par d’autres systèmes (Ah ! la force d’une syntaxe normalisée…). Cela vous rappellera peut-être le principe de la knowledge box que j’avais mis au point, il y a quelques temps.

Améliorer l’interopérabilité et l’échange de données entre les sites Web

Les possibilités d’interopérabilité ouvertes par RDFa en constituent, à mon avis, son usage le plus prometteur. En effet, dans la mesure où RDFa offre la possibilité de structurer les données de manière indépendante de la structure en HTML de la page Web, il est alors possible de récupérer automatiquement les données d’une page Web pour les republier, les exploiter, les indexer à votre guise…

Ainsi, il serait bienvenu de revoir le principe des trackbacks en exploitant les données en RDFa, plutôt qu’un bout de RDF/XML placé en commentaire dans le code HTML. Cela éviterait certainement le spam monstrueux qui a peu à peu détruit cette fonctionnalité.

Laissez libre cours à votre imagination, je suis sûr que les usages vont apparaître peu à peu.

Causeries RDFa — 

Commentaires

Encore un billet très intéressant. Pour aller plus loin, existe-t-il un salon Jabber pour partager nos expériences concernant les technologies du Web Sémantique ? Ça me serait d'une grande utilité.
A ma connaissance, il n'existe pas de salon Jabber francophone. En revanche, il existe une liste de discussions, un canal IRC et, depuis ce week-end, un serveur SMOB (cf. mon précédent billet), choisissez votre moyen de communication préféré, vous trouverez toujours quelqu'un au bout.
Bonjour, À votre connaissance, quel est l'outil de publication web qui soit le plus adapté pour en faire un outil de publication "websemantique aware"? Est-ce Drupal, que vous semblez utiliser? Ou bien en conseillez-vous un autre? À défaut d'outil, quel est le langage ou le Framework qui, d'après vous, permettrez d'obtenir le plus rapidement un petit CMS pour éditer un blog avec un ou deux standard du websemantique comme RFDa, les microformat, ou XFN? Je suppose qu'il n'existe aucun outil tout fait qui contiennent ces fonctionnalités de base, mais peut-être allez-vous me démentir (d'ailleurs j'aimerais bien ne pas avoir à programmer un nouvel outil :-)
Je ne sais pas si je peux répondre à votre première question. En tant qu'utilisateur de Drupal, il est vrai que je trouve Drupal assez simple à adapter et ses développeurs continuent d'implémenter ces technologies. Mais Je dirais que tous les CMS qui proposent un système de templates sont assez simples à adapter (cf. l'expérience d'Igor avec Spip ou de David avec Django), il "suffit" d'introduire vos bouts de code en RDFa (ou microformats dont XFN, perso, je ne suis pas fan) dans vos templates. Effectivement, il n'existe à ma connaissance aucun outil qui propose par défaut une structuration en RDFa, les thèmes de certains CMS contiennent des microformats (Wordpress, Drupal), mais cela viendra et ce n'est pas très compliqué à faire et ce n'est pas vraiment de la programmation.
De même, pour le langage ou framework, David vous répondrait Python et Django ;-) pour ma part, utilisateur très modeste de PHP, je trouve ARC 2 parfait pour répondre à mes besoins (http://arc.semsol.org) et mes collègues vous dirait que Java est plus robuste. Bref, c'est la même réponse que d'habitude, les supports existant dans les différents langages (cf. mon diaporama de présentation), je vous conseille de choisir celui qui vous paraît le plus adapté à vos besoins.

Bonjour Got,

j'aimerais savoir si il existe un schéma de métadonnées pour les œuvres d'art ?

Je me prépare à faire un site drupal pour une artothèque et j'aimerais me servir de RDFa dans mes balise.

Merci et à bientôt

ciao

Bonjour, vous devriez regarder le projet eCulture qui utilise différents vocabulaires de description d'œuvres d'art (indiqués ici : http://e-culture.multimedian.nl/demo/session/search). L'ontologie la plus répandue pour traiter les œuvres d'art est le Cidoc CRM. Les formats de métadonnées que l'on utilise couramment pour décrire des œuvres d'art sont le VRAcore et le CDWA du Getty.
Merci beaucoup Manue !