Les petites cases

Causeries

L'antilope sur le Web est-elle un document ?

Ce billet est une réponse au commentaire de Jean-Michel Salaün sous mon précédent billet. J'espère que Jean-Michel Salaün excusera la forme de ma réponse (c'était plus simple à gérer vu la longueur) et la distance que j'introduis par rapport à son commentaire (l'écriture d'un billet n'est pas le même exercice qu'un commentaire et il me semblait difficile de m'adresser directement à vous dans un billet :-) ).

Lire la suite...

Management de l'information Web sémantique Causeries Histoire —  4 commentaires

Les carcans de la pensée hiérarchique et documentaire (2)

Ce billet constitue la suite du précédent billet dont je vous conseille la lecture préalable si ce n'est déjà fait.

Lire la suite...

Structuration Web sémantique XML Système d'information Causeries Édition électronique —  7 commentaires

Les carcans de la pensée hiérarchique et documentaire (1)

Dans un billet intitulé « Comment organiser l'information pour y naviguer efficacement », j'essayais d'analyser en quoi l'organisation hiérarchique de l'information, issue des pratiques d'organisation physique de l'information, que ce soit dans un livre-codex ou sur un système de fichiers, influençait notre pratique du Web et comment, peu à peu, l'hypertexte et certaines pratiques, alors naissantes, comme la folksonomie ou la multiplication des métadonnées pouvaient permettre de dépasser ce paradigme pour démultiplier les accès à l'information et donc son exploitation. Je vous propose de revenir sur ces questions pour comprendre en quoi il est nécessaire aujourd'hui pour appréhender au mieux les enjeux du Web de données de s'abstraire de ce paradigme pour aller vers un nouveau modèle d'organisation et de modélisation de l'information.

Lire la suite...

Structuration Web sémantique XML Système d'information Causeries Histoire —  11 commentaires

Les professionnels de l'information face aux défis du Web de données

Dans le prolongement de mon billet de la semaine dernière, je choisis une nouvelle fois la solution de facilité en vous proposant le diaporama de la communication effectuée dans le cadre de la journée d'études organisée le 7 avril 2009 par l'ADBS et l'EDB intitulée "Quel Web demain ?".

Public différent, traitement différent (mais sujet quasi-identique ;-) ) : l'objectif était ici de présenter aux professionnels de l'information le Web de données et le rôle qu'ils pourraient jouer dans le contexte de cette nouvelle étape de l'édification du Web, d'où le titre : « les professionnels de l'information face aux défis du Web de données ». Cette communication a été l'occasion de définir pour la première fois un sujet qui m'occupe en ce moment, à savoir, l'architecture de données, qui me semble ouvrir des perspectives intéressantes dans la construction des systèmes d'information.

Bonne lecture !

Lire la suite...

Management de l'information Web sémantique Système d'information Causeries —  2 commentaires

Impressions sur le Sony reader

Après Marin, Christian, René Audet et certainement d’autres, il m’a semblé intéressant de partager avec vous mes impressions sur le Sony reader que j’utilise depuis un peu plus d’un mois et d’expliquer pourquoi il me donne entière satisfaction du point de vue de l’objet, de la vision qu’il porte du livre et de l’offre proposée.

Lire la suite...

Causeries Édition électronique —  8 commentaires

ISWC 2008 : premières impressions générales

J'ai la chance d'assister depuis hier à la conférence internationale annuelle sur le Web sémantique (ISWC) qui a lieu cette année à Karlsruhe, pour, entre autres, en compagnie de Manue, présenter, sous forme d'un poster, comment nous utilisons les technologies du Web sémantique dans le cadre du système de conservation du document numérique de la BnF (SPAR) que développe, en ce moment, Atos Origin.

C'est évidemment une excellente occasion pour prendre le pouls du Web sémantique et de sa communauté, de rencontrer toutes les personnes que je suis ou avec qui je suis en contact sur le Web (la liste serait trop longue, vous vous reconnaitrez ;-) ) et d'avoir des discussions passionnantes au grés des rencontres (merci à tous !).

Lire la suite...

Web sémantique Causeries —  4 commentaires

Silence, annonce et remerciements

Comme beaucoup d'entre vous le savent déjà, s'ils lisent Manue ou suivent mon fil Twitter, la famille s'est agrandie, avec bonheur, à la fin du mois de juin d'un petit Gabriel. Le fiston se porte à merveille et grandit de jour en jour.

Lire la suite...

Causeries Perso —  3 commentaires

Yahoo apporte des bananes au Web sémantique, 1ère partie

Annoncé, il y un peu plus de 2 mois, « l’écosystème de développement pour la recherche » de Yahoo est maintenant disponible sous le nom de SearchMonkey. Si, avec cette initiative, le but de Yahoo était de reprendre la main sur Google dans le domaine strict de la recherche, il me semble qu’une partie du chemin a été effectuée. Plutôt, que d’attaquer frontalement Google en mettant en œuvre de nouveaux algorithmes de recherche, par exemple, Yahoo a choisi un angle différent jusqu’alors complètement inexploité et, pourtant, oh ! combien important, à savoir la présentation des résultats.

Et, dans ce cadre, aiguillé certainement par le succès de facebook et de sa plate-forme de développement ouvert, le moteur de recherche a mis à disposition des développeurs une plate-forme pour mettre au point des applications qui agrémentent, selon la volonté des utilisateurs, les résultats de la recherche. Pour ce faire, il rend disponible les données de son index, soit les données structurées avec des microformats, RDFa et eRDF (embeded RDF, un système à peu près équivalent à RDFa) et déjà indexées, par défaut, par Yahoo, soit directement l’ensemble des données de la page Web à partir desquelles le développeur peut créer une extraction personnelle.

La plate-forme SearchMonkey comprend donc trois parties (et donc trois billets pour le présenter…) :

  • Une à destination des utilisateurs ;
  • Une à destination des développeurs ;
  • Une à destination des propriétaires de sites.

Lire la suite...

Causeries Indexation Moteur de recherche RDFa —  9 commentaires

RDFaiser votre blog, 3ème partie : l’exploitation

Si HTML permet de structurer une page Web dans une visée documentaire, RDFa permet d’en structurer, de manière indépendante, les données. Au final, RDFa ajoute donc une troisième couche aux deux existantes :

  • HTML pour structurer la page Web ;
  • CSS pour structurer la mise en forme de la page Web ;
  • RDFa pour structurer les données de la page Web.

Il est difficile de prévoir aujourd’hui tous les usages possibles de RDFa ; ils restent encore largement à inventer. En effet, et c’est le propre et l’intérêt des technologies du Web sémantique, la modélisation des données en RDF est indépendante des usages qui en sont faits. Malgré tout, il est d’ors et déjà possible d’identifier quelques usages.

Lire la suite...

Causeries RDFa —  7 commentaires

Du Web sémantique au web de données, 2ème partie : retour sur un des articles de Roger T. Pédauque

Dans un billet récent écrit à l'occasion des dix ans de XML, Jean-Michel Salaün regrettait que les pistes esquissés dans le second texte de l'initiative Roger T. Pédauque intitulé «  Le texte en jeu. Permanences et transformations du document  » n'aient pas été suivies. Et, pour cause me semble-t-il, si ce deuxième article, comme les deux autres d'ailleurs, apporte incontestablement des pistes de réflexion et certaines idées intéressantes, il comprend des contre-sens et des erreurs si manifestes qu'il n'est possible de s'en servir comme base de travail qu'après une critique attentive, sans compter sur le style que Jean-Michel Salaün lui-même dans le billet cité plus haut qualifie « d'un peu abscons » et que je qualifierais plus volontiers de charabia jargonnant.

A l'heure où le Web sémantique pointe avec plus de prégnance le bout de son nez, il n'est pas inutile de revenir sur ce texte, comme sur les deux autres, pour construire une nouvelle réflexion. C'était d'ailleurs leur but : susciter le débat et la réflexion, sans présager des évolutions futures et selon l'état de l'art du moment. Or, il semble bien qu'une nouvelle étape est sur le point d'être franchie, si ce n'est pas déjà le cas. A titre personnel, si, à l'époque de rédaction du texte, je n'étais pas en mesure de m'immiscer dans le débat, j'espère, aujourd'hui, pouvoir apporter ma pierre à l'édifice.

Avant d'entrer dans le vif du sujet, je voudrais rappeler, pour mémoire, que cette initiative avait été lancée par le réseau thématiques pluridisciplinaires dédié au document, le RTP-DOC d'où le pseudonyme Roger T. Pédauque pour signer les textes collectifs, placé sous le patronage de feu le département STIC du CNRS. L'objectif était de réfléchir selon une approche pluridisciplinaire à la notion de document dans le contexte des changements induits par le numérique.

Lire la suite...

Structuration RDF XML Causeries Indexation Moteur de recherche OWL TEI Validation XHTML Xquery XSLT —  7 commentaires