OWL

Du Web sémantique au web de données, 2ème partie : retour sur un des articles de Roger T. Pédauque

Dans un billet récent écrit à l'occasion des dix ans de XML, Jean-Michel Salaün regrettait que les pistes esquissés dans le second texte de l'initiative Roger T. Pédauque intitulé «  Le texte en jeu. Permanences et transformations du document  » n'aient pas été suivies. Et, pour cause me semble-t-il, si ce deuxième article, comme les deux autres d'ailleurs, apporte incontestablement des pistes de réflexion et certaines idées intéressantes, il comprend des contre-sens et des erreurs si manifestes qu'il n'est possible de s'en servir comme base de travail qu'après une critique attentive, sans compter sur le style que Jean-Michel Salaün lui-même dans le billet cité plus haut qualifie « d'un peu abscons » et que je qualifierais plus volontiers de charabia jargonnant.

A l'heure où le Web sémantique pointe avec plus de prégnance le bout de son nez, il n'est pas inutile de revenir sur ce texte, comme sur les deux autres, pour construire une nouvelle réflexion. C'était d'ailleurs leur but : susciter le débat et la réflexion, sans présager des évolutions futures et selon l'état de l'art du moment. Or, il semble bien qu'une nouvelle étape est sur le point d'être franchie, si ce n'est pas déjà le cas. A titre personnel, si, à l'époque de rédaction du texte, je n'étais pas en mesure de m'immiscer dans le débat, j'espère, aujourd'hui, pouvoir apporter ma pierre à l'édifice.

Avant d'entrer dans le vif du sujet, je voudrais rappeler, pour mémoire, que cette initiative avait été lancée par le réseau thématiques pluridisciplinaires dédié au document, le RTP-DOC d'où le pseudonyme Roger T. Pédauque pour signer les textes collectifs, placé sous le patronage de feu le département STIC du CNRS. L'objectif était de réfléchir selon une approche pluridisciplinaire à la notion de document dans le contexte des changements induits par le numérique.

Le Web sémantique rencontre....

Preuve de la maturité des technologies et des standards du Web sémantique, les chercheurs et promoteurs du domaine vont à la rencontre d'autres communautés pour leur proposer de nouvelles applications, des idées, des tutoriaux, leurs expertises... Bref, des rencontres se produisent qui amènent des projets qui montrent chaque jour un peu plus la pertinence du modèle. Voici une petite sélection repérée ces derniers jours.

Le code de la knowledge box

Plusieurs d'entre vous m'ont demandé le code de la knowledge box. C'est avec plaisir que je vous en fais part, mais autant vous prévenir tout de suite je suis un très mauvais codeur quand il s'agit d'utiliser un langage de programmation. Merci d'avance pour votre indulgence à ce niveau ;-).

Six parties composent la knowledge box :

Amusons-nous avec RDFa

En vue d'explorer les possibilités de RDFa, j'ai mis au point une petite application. Dans la barre à droite sur ce billet, j'ai ajouté une boîte dite Knowledge box. Son principe est simple. En cliquant sur un terme, le résumé de sa définition dans Wikipedia et un lien vers la page de la Wikipedia francophone s'affichent.

En soi, l'idée n'est pas révolutionnaire et j'aurais pu le faire sans déployer toute l'artillerie des technologies du Web sémantique, mais ce qui me paraît intéressant dans cette expérience, c'est de montrer les atouts de disposer d'une syntaxe normalisée pour repérer des entités, RDFa, qui peut être exploitée de différentes façons, comme je le montrais dans mon précédent billet sur le sujet,

Petite pelote pour pull multicolore

Quelques ressources intéressantes arrivées dans mon agrégateur ces deux dernières semaines.

Frederick Giasson annonce la mise en place d’un groupe de travail dont il fera partie au titre du projet Zitgist sur l’élaboration d’une « ontologie bibliographique », orientée vers la modélisation de la citation bibliographique. L’équipe de l’excellente extension firefox « Zotero » est dans le coup et ils n’ont pas prévu de réinventer la roue, puisqu’ils souhaitent s’appuyer sur FRBR, Dublin Core, FOAF ou SIOC, entre autres. Si vous voulez mon avis, c’est un projet à suivre vu les personnes impliquées.

Seth Ladd m’a permis de découvrir une application en ligne qui me réconcilie avec AJAX : Dabble DB. Il s’agit

Les systèmes de classification et de modélisation des connaissances

Les débats sur la folksonomie et les explications sur le Web sémantique qui fleurissent un peu partout sur le Web autour du pseudo-concept de Web 3.0 font apparaître, bien souvent, une méconnaissance des différents systèmes de classification et de modélisation des connaissances, comme je l'avais montré à propos de l'article de Clay Shirky, l'ontologie est surfaite.

Apprivoiser le hibou 2

Après avoir vu comment construire son ontologie à partir de classes et de propriétés existantes, je vous propose d'étudier la définition des classes et des propriétés dans votre propre ontologie.

Type, Classe, instance

Définir une classe n'est pas si évident qu'il n'y paraît.

Apprivoiser le hibou 1

Depuis quelques semaines, je travaille à l'élaboration d'une ontologie. J'espère pouvoir dans les prochaines semaines vous parler de ce projet ici-même.

Le Web sémantique à l'honneur

Pour continuer sur ma lancée de cette nuit et avant de reprendre le dossier consacré à la conservation du document numérique, je vais comme promis vous proposer une pelote de liens concernant le Web sémantique ce qui va me permettre de vider définitivement mon agrégateur :-) (après promis, je ne vous parle plus de mes problèmes existentiels concernant mes rapports avec lui.)

La diffusion du Web sémantique : priorité du W3C et de Tim Berners-Lee ?

Voilà une question qui me taraude depuis quelques semaines. Après avoir travaillé à la diffusion des standards permettant de faire des pages Web : XHTML/CSS, relayé dans ce travail par une importante communauté dont le WASP et la mozilla foundation ne sont que des représentants parmi d'autres, c'est à dire la brique de base du Web semantic stack, il me semble que le W3C veuille passer à la vitesse supérieure sur le Web sémantique. Plusieurs indices peuvent être relevés :

Syndiquer le contenu