Les petites cases

Pourquoi utiliser une syntaxe XML pour les métadonnées ?

Last week at the Access 2005 conference, I told a room full of mostly library people that their XML standards (I was talking about MODS and MADS in particular) are needlessly complex, inflexible, and awkward; that they were not hacker-friendly. I showed them an alternative schema I’ve been working on that is better, cleaner and much more hacker-friendly XML. Modeled on DOAP, this schema also happens to be RDF, and I exploit the basic plumbing of RDF like its linking support (which I explained was much more consistent than the use of xlink in MODS) to yield a data representation that I think may well be close to a perfect balance of simplicity and expressiveness for citation-related metadata.

XML and RDF

A l'image de cette citation, je me demande vraiment pourquoi les bibliothécaires continuent à penser leurs descriptions de métadonnées avec la syntaxe XML. Alors que la syntaxe RDF et ses dérivés RDF schéma, SKOS ou même OWL offrent tous les outils pour décrire des ressources, c'est à dire créer des métadonnées, ils continuent de développer leurs différents schémas METS, MODS, MADS, TEF ou même EAC selon une syntaxe XML. Il n'y a guère que Dublin Core pour me contredire.

Combien de temps faudra-t-il encore répéter que la syntaxe XML sert à structurer les données et que la syntaxe RDF sert à organiser les métadonnées. METS, pour ne citer que lui, ne rentre-t-il pas dans la deuxième catégorie ?

Manue a déjà essayé de m'expliquer qu'il faut du temps et que l'appropriation viendra. Je veux bien le comprendre mais, pendant ce temps-là, des applications et des systèmes sont développés et j'ai l'impression que, plus on attend et plus l'investissement pour faire le bond technologique sera considérable voire impossible. A mon avis, c'est bien dommage quand on pense aux applications possibles avec les technologies du Web sémantique.

D'où ma question : où se situe le problème ? Dans la syntaxe ? Dans la compréhension des concepts sous-jacents ? Dans la mise en place des outils ? Dans la peur de retomber dans des systèmes complexes comme RAMEAU ? Dans le fait qu'il faut s'approprier deux nouvelles technologies XML et RDF de façon trop rapprochée ?

Manue, Marlène et les autres, dites-moi, il se situe où le problème ?

Via Lost boy

Structuration Web sémantique XML Causeries — 

Commentaires

> il se situe où le problème ? Chez toi. Le XML sert à structurer les données, certes. Mais les méta-données ne sont-elles pas des données, après tout ?

Houlà ! pas évident de revenir sur un billet écrit il y a 2 ans et demi. Merci donc, gentil troll anonyme, de me faire prendre conscience du chemin parcouru depuis la rédaction de ce billet. Alors, reprenons calmement et précisons les choses qui relevaient alors plus de l'intuition que d'une véritable argumentation.

Il ne faut pas confondre syntaxe et modèle (confusion que je fais dans ce billet). XML est à la fois une syntaxe et un modèle de description de l'information sous forme d'arbre. RDF est simplement un modèle de description sous forme de graphes qui peut être exprimé selon plusieurs syntaxes : n-triples, turtle, RDF/XML, n3, RDFa.

La question est donc la suivante : lorsqu'on encode des métadonnées (terme qui me gêne de plus en plus, mais il serait un peu long de revenir dessus et ce serait vous faire trop d'honneur), est-ce-que l'on cherche à encoder une notice documentaire/un inventaire/une liste structurée de données dans le cadre d'un type de document particulier OU cherche-t-on à encoder les relations entre un objet et des données qui le caractérisent et entre les différentes données elles-même ?

En fonction de la réponse à la question, vous choisirez le modèle d'encodage qui convient, dans le premier cas : XML, dans le second cas : RDF. Mais, il est grand temps de sortir du carcan de la notice documentaire, qu'on apparente finalement à un document et de penser véritablement les métadonnées comme des données reliées à un objet (ou plutôt une ressource), d'autant qu'il est loin d'être évident d'exploiter un arbre XML dans le cas où il existe beaucoup de liens entre différents noeuds à différents niveaux de granularité

<troll>je vous invite pour vous en convaincre à comparer Xquery (langage de requêtes de XML) et Sparql (langage de requêtes de RDF) pour exploiter des métadonnées</troll> (Oui ! moi aussi, je sais troller ;-) )