Les petites cases

Outils

La pérennisation de l'information numérique, mature ! Vraiment ?

Alors que l'avion nous ramenant en France survole les Etats-Unis et l'Océan atlantique, il est temps de prendre du recul pour tirer les leçons de notre séjour californien à l'occasion de la grande messe annuelle de la pérennisation de l'information numérique, IPRES, qui avait lieu cette année à San Fransisco. La conférence s'intitulait « Moving into the mainstream. Enabling our digital future » et était donc principalement axée sur des problématiques liées à l'organisation, l'économie et les moyens de garantir l'activité même de la pérennisation de l'information numérique. Cet intitulé impliquait l'idée que nous entrions dans une ère de maturité et de production après quelques années de recherche et de développement sur le sujet.

A l'issue de la conférence et des discussions avec les uns et les autres (le plus intéressant dans une conférence !), j'ai un sentiment mitigé. Bien sûr, le chemin parcouru est déjà très important au regard des enjeux et du défaitisme qui avait cours, il y a quelques années. Pourtant, deux tendances me semblent avoir fait leur apparition et viennent limiter ce sentiment de maturité :

  • le champ des possibles dans le domaine reste terriblement vaste, à la fois en termes de types de ressources numériques à couvrir et de moyens à tous les niveaux pour assurer une pérennisation efficiente 
  • une fracture est en train de se créer entre différentes conceptions de ce que peut/doit constituer l'activité de pérennisation de l'information numérique.

Lire la suite...

Système d'information Causeries Conservation —  3 commentaires

Contrer les idées reçues sur le Web sémantique

La médiatisation d'un nouveau concept, d'une nouvelle notion, d'une nouvelle technologie et de nouvelles perspectives s'accompagne immanquablement d'analyses plus ou moins farfelues, d'incompréhensions et d'interprétations erronnées (parfois volontairment pour profiter du buzz). Le Web sémantique n'échappe à cette tendance.

A l'instar de James Hendler qui a publié sa FAQ non officielle sur le Web sémantique, je vous propose de mon côté de revenir sur quelques idées reçues sur le Web sémantique.

Lire la suite...

Management de l'information Web sémantique Système d'information Causeries Moteur de recherche —  6 commentaires

Les carcans de la pensée hiérarchique et documentaire (2)

Ce billet constitue la suite du précédent billet dont je vous conseille la lecture préalable si ce n'est déjà fait.

Lire la suite...

Structuration Web sémantique XML Système d'information Causeries Édition électronique —  7 commentaires

Les carcans de la pensée hiérarchique et documentaire (1)

Dans un billet intitulé « Comment organiser l'information pour y naviguer efficacement », j'essayais d'analyser en quoi l'organisation hiérarchique de l'information, issue des pratiques d'organisation physique de l'information, que ce soit dans un livre-codex ou sur un système de fichiers, influençait notre pratique du Web et comment, peu à peu, l'hypertexte et certaines pratiques, alors naissantes, comme la folksonomie ou la multiplication des métadonnées pouvaient permettre de dépasser ce paradigme pour démultiplier les accès à l'information et donc son exploitation. Je vous propose de revenir sur ces questions pour comprendre en quoi il est nécessaire aujourd'hui pour appréhender au mieux les enjeux du Web de données de s'abstraire de ce paradigme pour aller vers un nouveau modèle d'organisation et de modélisation de l'information.

Lire la suite...

Structuration Web sémantique XML Système d'information Causeries Histoire —  11 commentaires

Les professionnels de l'information face aux défis du Web de données

Dans le prolongement de mon billet de la semaine dernière, je choisis une nouvelle fois la solution de facilité en vous proposant le diaporama de la communication effectuée dans le cadre de la journée d'études organisée le 7 avril 2009 par l'ADBS et l'EDB intitulée "Quel Web demain ?".

Public différent, traitement différent (mais sujet quasi-identique ;-) ) : l'objectif était ici de présenter aux professionnels de l'information le Web de données et le rôle qu'ils pourraient jouer dans le contexte de cette nouvelle étape de l'édification du Web, d'où le titre : « les professionnels de l'information face aux défis du Web de données ». Cette communication a été l'occasion de définir pour la première fois un sujet qui m'occupe en ce moment, à savoir, l'architecture de données, qui me semble ouvrir des perspectives intéressantes dans la construction des systèmes d'information.

Bonne lecture !

Lire la suite...

Management de l'information Web sémantique Système d'information Causeries —  2 commentaires

Limites du modèle relationnel et Web sémantique

Non ! ce blog n'est pas mort comme tant d'autres, mais je ne trouve tout simplement pas le temps de bloguer en ce moment. Pourtant, ce n'est pas les sujets qui manquent, d'autant que chaque jour nous apporte son lot de bonne nouvelle sur le front du Web sémantique.

Pour me faire pardonner et vous faire patienter, je vous propose le diaporama d'une communication que j'ai faite avec mon excellent collègue, Alexandre Bertails, alias betehess, alias l'homme qui résout les sudokus avec OWL, alias l'homme qui murmure à l'oreille de Pellet, à l'occasion de la conférence "Web version 2 et suivantes" dans le cadre de Solution Linux. L'objectif de cette présentation était de montrer en quoi les technologies du Web sémantique constituent des réponses à certaines limites du modèle des bases de données relationnelles et donc en quoi elles peuvent avoir leur place dans les systèmes d'information traditionnelles. Je pense que certains lecteurs de ce blog pourront ainsi mieux se rendre compte de l'apport des technologies du Web sémantique pour la gestion des données structurées.

Bonne lecture !

Lire la suite...

RDF Système d'information Sparql OWL Geekeries Linked Data —  12 commentaires

Migration de ce site de Drupal 5 à Drupal 6

Pour des raisons que vous comprendrez bientôt (reprenons la mauvaise habitude du teasing ;-) ), il m'a fallu migrer ce site de Drupal 5 à Drupal 6. A la demande de Charles, je vous propose dans ce billet un compte-rendu de cette expérience.

Pour commencer, il faut suivre pas à pas et strictement les étapes décrites dans le fichier UPGRADE.txt disponible dans l'archive de Drupal 6. Si vous vous ne sentez pas après cette lecture, vous pouvez consulter ce screencast très complet qui décrit la procédure de migration.

Lire la suite...

Outils Geekeries —  1 commentaire

Yahoo apporte des bananes au Web sémantique, 1ère partie

Annoncé, il y un peu plus de 2 mois, « l’écosystème de développement pour la recherche » de Yahoo est maintenant disponible sous le nom de SearchMonkey. Si, avec cette initiative, le but de Yahoo était de reprendre la main sur Google dans le domaine strict de la recherche, il me semble qu’une partie du chemin a été effectuée. Plutôt, que d’attaquer frontalement Google en mettant en œuvre de nouveaux algorithmes de recherche, par exemple, Yahoo a choisi un angle différent jusqu’alors complètement inexploité et, pourtant, oh ! combien important, à savoir la présentation des résultats.

Et, dans ce cadre, aiguillé certainement par le succès de facebook et de sa plate-forme de développement ouvert, le moteur de recherche a mis à disposition des développeurs une plate-forme pour mettre au point des applications qui agrémentent, selon la volonté des utilisateurs, les résultats de la recherche. Pour ce faire, il rend disponible les données de son index, soit les données structurées avec des microformats, RDFa et eRDF (embeded RDF, un système à peu près équivalent à RDFa) et déjà indexées, par défaut, par Yahoo, soit directement l’ensemble des données de la page Web à partir desquelles le développeur peut créer une extraction personnelle.

La plate-forme SearchMonkey comprend donc trois parties (et donc trois billets pour le présenter…) :

  • Une à destination des utilisateurs ;
  • Une à destination des développeurs ;
  • Une à destination des propriétaires de sites.

Lire la suite...

Causeries Indexation Moteur de recherche RDFa —  9 commentaires

Smob : le Twitter version Web sémantique

Tukka Hastrup, Uldis Bojars, John Breslin et l’inévitable Alexandre Passant ont mis au point Smob, un système de micoblogging décentralisé basé sur les technologies du Web sémantique, en particulier SIOC, choix logique quand on sait que les quatre développeurs en sont des contributeurs actifs. Cette application démontre parfaitement en quoi les technologies du Web sémantique vont offrir aux utilisateurs (pour ne pas dire « utilisacteurs ») un meilleur contrôle de leurs données dans le cadre de l’écosystème mis en place par le Web 2.0.

Lire la suite...

Management de l'information Web sémantique Blog Geekeries —  7 commentaires

Du Web sémantique au web de données, 2ème partie : retour sur un des articles de Roger T. Pédauque

Dans un billet récent écrit à l'occasion des dix ans de XML, Jean-Michel Salaün regrettait que les pistes esquissés dans le second texte de l'initiative Roger T. Pédauque intitulé «  Le texte en jeu. Permanences et transformations du document  » n'aient pas été suivies. Et, pour cause me semble-t-il, si ce deuxième article, comme les deux autres d'ailleurs, apporte incontestablement des pistes de réflexion et certaines idées intéressantes, il comprend des contre-sens et des erreurs si manifestes qu'il n'est possible de s'en servir comme base de travail qu'après une critique attentive, sans compter sur le style que Jean-Michel Salaün lui-même dans le billet cité plus haut qualifie « d'un peu abscons » et que je qualifierais plus volontiers de charabia jargonnant.

A l'heure où le Web sémantique pointe avec plus de prégnance le bout de son nez, il n'est pas inutile de revenir sur ce texte, comme sur les deux autres, pour construire une nouvelle réflexion. C'était d'ailleurs leur but : susciter le débat et la réflexion, sans présager des évolutions futures et selon l'état de l'art du moment. Or, il semble bien qu'une nouvelle étape est sur le point d'être franchie, si ce n'est pas déjà le cas. A titre personnel, si, à l'époque de rédaction du texte, je n'étais pas en mesure de m'immiscer dans le débat, j'espère, aujourd'hui, pouvoir apporter ma pierre à l'édifice.

Avant d'entrer dans le vif du sujet, je voudrais rappeler, pour mémoire, que cette initiative avait été lancée par le réseau thématiques pluridisciplinaires dédié au document, le RTP-DOC d'où le pseudonyme Roger T. Pédauque pour signer les textes collectifs, placé sous le patronage de feu le département STIC du CNRS. L'objectif était de réfléchir selon une approche pluridisciplinaire à la notion de document dans le contexte des changements induits par le numérique.

Lire la suite...

Structuration RDF XML Causeries Indexation Moteur de recherche OWL TEI Validation XHTML Xquery XSLT —  7 commentaires