Ce billet constitue la suite du précédent billet dont je vous conseille la lecture préalable si ce n'est déjà fait.
Ce billet constitue la suite du précédent billet dont je vous conseille la lecture préalable si ce n'est déjà fait.
Dans un billet intitulé « Comment organiser l'information pour y naviguer efficacement », j'essayais d'analyser en quoi l'organisation hiérarchique de l'information, issue des pratiques d'organisation physique de l'information, que ce soit dans un livre-codex ou sur un système de fichiers, influençait notre pratique du Web et comment, peu à peu, l'hypertexte et certaines pratiques, alors naissantes, comme la folksonomie ou la multiplication des métadonnées pouvaient permettre de dépasser ce paradigme pour démultiplier les accès à l'information et donc son exploitation. Je vous propose de revenir sur ces questions pour comprendre en quoi il est nécessaire aujourd'hui pour appréhender au mieux les enjeux du Web de données de s'abstraire de ce paradigme pour aller vers un nouveau modèle d'organisation et de modélisation de l'information.
Dans le prolongement de mes billets RDF pour les nuls et A la découverte du Web sémantique, je vous propose de découvrir RDF en cinq minutes à travers quelques slides créés pour des formations au Web sémantique, que j'ai données ces dernières semaines.
Il faudrait que je l'accompagne de l'explication de texte, mais le temps me manque... Il faudra donc s'en contenter ou vous référer aux différents billets de ce blog sur la question.
PS : pour s'amuser, on fait un concours avec Manue : celui qui aura le plus de hit sur un diaporama sur son sujet favori. Alors, cliquez ! ;-)
Dans un billet récent écrit à l'occasion des dix ans de XML, Jean-Michel Salaün regrettait que les pistes esquissés dans le second texte de l'initiative Roger T. Pédauque intitulé « Le texte en jeu. Permanences et transformations du document » n'aient pas été suivies. Et, pour cause me semble-t-il, si ce deuxième article, comme les deux autres d'ailleurs, apporte incontestablement des pistes de réflexion et certaines idées intéressantes, il comprend des contre-sens et des erreurs si manifestes qu'il n'est possible de s'en servir comme base de travail qu'après une critique attentive, sans compter sur le style que Jean-Michel Salaün lui-même dans le billet cité plus haut qualifie « d'un peu abscons » et que je qualifierais plus volontiers de charabia jargonnant.
A l'heure où le Web sémantique pointe avec plus de prégnance le bout de son nez, il n'est pas inutile de revenir sur ce texte, comme sur les deux autres, pour construire une nouvelle réflexion. C'était d'ailleurs leur but : susciter le débat et la réflexion, sans présager des évolutions futures et selon l'état de l'art du moment. Or, il semble bien qu'une nouvelle étape est sur le point d'être franchie, si ce n'est pas déjà le cas. A titre personnel, si, à l'époque de rédaction du texte, je n'étais pas en mesure de m'immiscer dans le débat, j'espère, aujourd'hui, pouvoir apporter ma pierre à l'édifice.
Avant d'entrer dans le vif du sujet, je voudrais rappeler, pour mémoire, que cette initiative avait été lancée par le réseau thématiques pluridisciplinaires dédié au document, le RTP-DOC d'où le pseudonyme Roger T. Pédauque pour signer les textes collectifs, placé sous le patronage de feu le département STIC du CNRS. L'objectif était de réfléchir selon une approche pluridisciplinaire à la notion de document dans le contexte des changements induits par le numérique.
Dans le précédent billet, j'ai expliqué en quoi RDFa permettait de décrire la structure du message contenu dans une page Web et comment on pourrait facilement générer du RDFa à partir des données structurées dans la base de données de votre CMS. Je vous propose maintenant de passer de la théorie à la pratique.
Ce tutoriel suppose que vous connaissez XHTML et le principe de base de RDF.
HTML, de même que XHTML, permet de structurer une page Web selon les principes d'un langage à balises. Les différentes balises indiquent de manière hiérarchique le rôle joué par chaque portion d'information dans le contexte de la page Web.
Ainsi, la structure d'un document HTML, comme tout document XML, ne décrit pas le contenu/le message de la page Web, mais reflète la structure de la page Web en elle-même. C'est pourquoi il me semble erroné de parler de « sémantisation », lorsqu'on encode en HTML ou, plus généralement, en XML.
Par exemple, soient les deux portions de code HTML suivants :
<div class="contenu">
<p class="normal">
Le <a href="http://barcamp.org/SemanticCampParis">SemanticWeb camp</a> se déroule à Paris
le samedi 16 février 2008 à partir de 9h30.
</p>
</div>
<div class="description">
<ul>
<li>
Le <strong>SemanticWeb camp</strong> se déroule à Paris
le <em>samedi 16 février 2008 à partir de 9h30</em>.
</li>
</ul>
</div>
Ces deux bouts de code HTML ne sont pas identiques du point de vue de la structure, pourtant, du point de vue du contenu, ils délivrent la même information, le même message. Si certains pourraient y voir une limitation de XML, il n'en est rien. Ce n'est tout simplement pas son rôle.
L'ADBS m'a donné l'occasion, la semaine dernière, de me replonger avec grand plaisir dans la TEI à l'occasion d'un 5 à 7. Le but ce cette séance était d'en présenter le principe et le fonctionnement. Ma présentation s'attache donc à montrer les particularités de la TEI et en quoi elle constitue une solution générique à l'encodage des textes en repartant des buts poursuivis par l'encodage et de la démarche particulière de sa conception.
Je me suis inspiré pour la mettre au point des documents, en particulier une présentation de Lou Burnard, Sebastian Rahtz et Matthew Driscoll faite à l'occasion d'une formation à Sofia, mis à disposition sur le nouveau site du consortium TEI dévoilé à l'occasion de son 20ème anniversaire et de la sortie en version finale de la nouvelle version, la P5.
Après toutes ces mois à m'intéresser à RDF, cela a aussi été une opportunité pour préciser dans mon esprit les différences entre RDF et XML et d'affiner mes réflexions sur le concept de texte et de document. Mais, c'est une autre histoire que j'espère pouvoir partager avec vous dans les semaines qui viennent, s'il me reste un peu de temps ;-)
Bonne lecture !
Il aura fallu que je sois bloqué chez moi pour finir de vider mon agrégateur de tout ce qui s'était accumulé avant et pendant les vacances. Et, pour finir définitivement cette opération qui m'aura pris pas mal de temps, voici quelques ressources qui ont plus particulièrement retenu mon attention.
Du côté du Web sémantique, les deux sujets à la une restent "linked data" et RDF/A.
Dans une organisation, on crée et on échange de l'information. Mais on n'y accède pas de manière uniforme : selon les personnes qui veulent y accéder ou utiliser ces informations, selon leurs différentes fonctions dans l'organisation, ils auront besoin d'y accéder de manière différente, pour des besoins différents. Toutefois, l'information, elle, reste toujours la même : c'est sa présentation et son usage qui change, ce sont les différents services que l'on construit au-dessus de cette information qui doivent changer suivant les besoins.
Si vous vous intéressez à l'avenir du Web, de ses technologies et pour certains d'entre vous à leurs applications dans les sciences humaines, vous allez être ravis, puisque ce n'est pas moins de trois conférences essentielles dont vous trouverez en ligne les communications, résumés et compte-rendus en ligne.