Les petites cases

Migration de ce site de Drupal 5 à Drupal 6

Pour des raisons que vous comprendrez bientôt (reprenons la mauvaise habitude du teasing ;-) ), il m'a fallu migrer ce site de Drupal 5 à Drupal 6. A la demande de Charles, je vous propose dans ce billet un compte-rendu de cette expérience.

Pour commencer, il faut suivre pas à pas et strictement les étapes décrites dans le fichier UPGRADE.txt disponible dans l'archive de Drupal 6. Si vous vous ne sentez pas après cette lecture, vous pouvez consulter ce screencast très complet qui décrit la procédure de migration.

Lire la suite...

Outils Geekeries —  1 commentaire

Silence, annonce et remerciements

Comme beaucoup d'entre vous le savent déjà, s'ils lisent Manue ou suivent mon fil Twitter, la famille s'est agrandie, avec bonheur, à la fin du mois de juin d'un petit Gabriel. Le fiston se porte à merveille et grandit de jour en jour.

Lire la suite...

Causeries Perso —  3 commentaires

Yahoo apporte des bananes au Web sémantique, 1ère partie

Annoncé, il y un peu plus de 2 mois, « l’écosystème de développement pour la recherche » de Yahoo est maintenant disponible sous le nom de SearchMonkey. Si, avec cette initiative, le but de Yahoo était de reprendre la main sur Google dans le domaine strict de la recherche, il me semble qu’une partie du chemin a été effectuée. Plutôt, que d’attaquer frontalement Google en mettant en œuvre de nouveaux algorithmes de recherche, par exemple, Yahoo a choisi un angle différent jusqu’alors complètement inexploité et, pourtant, oh ! combien important, à savoir la présentation des résultats.

Et, dans ce cadre, aiguillé certainement par le succès de facebook et de sa plate-forme de développement ouvert, le moteur de recherche a mis à disposition des développeurs une plate-forme pour mettre au point des applications qui agrémentent, selon la volonté des utilisateurs, les résultats de la recherche. Pour ce faire, il rend disponible les données de son index, soit les données structurées avec des microformats, RDFa et eRDF (embeded RDF, un système à peu près équivalent à RDFa) et déjà indexées, par défaut, par Yahoo, soit directement l’ensemble des données de la page Web à partir desquelles le développeur peut créer une extraction personnelle.

La plate-forme SearchMonkey comprend donc trois parties (et donc trois billets pour le présenter…) :

  • Une à destination des utilisateurs ;
  • Une à destination des développeurs ;
  • Une à destination des propriétaires de sites.

Lire la suite...

Causeries Indexation Moteur de recherche RDFa —  9 commentaires

RDFaiser votre blog, 3ème partie : l’exploitation

Si HTML permet de structurer une page Web dans une visée documentaire, RDFa permet d’en structurer, de manière indépendante, les données. Au final, RDFa ajoute donc une troisième couche aux deux existantes :

  • HTML pour structurer la page Web ;
  • CSS pour structurer la mise en forme de la page Web ;
  • RDFa pour structurer les données de la page Web.

Il est difficile de prévoir aujourd’hui tous les usages possibles de RDFa ; ils restent encore largement à inventer. En effet, et c’est le propre et l’intérêt des technologies du Web sémantique, la modélisation des données en RDF est indépendante des usages qui en sont faits. Malgré tout, il est d’ors et déjà possible d’identifier quelques usages.

Lire la suite...

Causeries RDFa —  7 commentaires

Smob : le Twitter version Web sémantique

Tukka Hastrup, Uldis Bojars, John Breslin et l’inévitable Alexandre Passant ont mis au point Smob, un système de micoblogging décentralisé basé sur les technologies du Web sémantique, en particulier SIOC, choix logique quand on sait que les quatre développeurs en sont des contributeurs actifs. Cette application démontre parfaitement en quoi les technologies du Web sémantique vont offrir aux utilisateurs (pour ne pas dire « utilisacteurs ») un meilleur contrôle de leurs données dans le cadre de l’écosystème mis en place par le Web 2.0.

Lire la suite...

Management de l'information Web sémantique Blog Geekeries —  7 commentaires

A la découverte du Web sémantique et de ses technologies

Pour vous faire patienter avant que ce blog ne reprenne un rythme normal de publication (d'ici un mois ou deux...), je vous propose une présentation du Web sémantique et de ses technologies sous la forme d'un diaporama. Il a été mis au point pour présenter le sujet à mes nouveaux collègues. J'espère qu'il pourra vous aider à mieux comprendre les buts poursuivis par le Web sémantique et ses technologies.

Bonne lecture et à bientôt !

Lire la suite...

Web sémantique Geekeries —  15 commentaires

Du Web sémantique au web de données, 2ème partie : retour sur un des articles de Roger T. Pédauque

Dans un billet récent écrit à l'occasion des dix ans de XML, Jean-Michel Salaün regrettait que les pistes esquissés dans le second texte de l'initiative Roger T. Pédauque intitulé «  Le texte en jeu. Permanences et transformations du document  » n'aient pas été suivies. Et, pour cause me semble-t-il, si ce deuxième article, comme les deux autres d'ailleurs, apporte incontestablement des pistes de réflexion et certaines idées intéressantes, il comprend des contre-sens et des erreurs si manifestes qu'il n'est possible de s'en servir comme base de travail qu'après une critique attentive, sans compter sur le style que Jean-Michel Salaün lui-même dans le billet cité plus haut qualifie « d'un peu abscons » et que je qualifierais plus volontiers de charabia jargonnant.

A l'heure où le Web sémantique pointe avec plus de prégnance le bout de son nez, il n'est pas inutile de revenir sur ce texte, comme sur les deux autres, pour construire une nouvelle réflexion. C'était d'ailleurs leur but : susciter le débat et la réflexion, sans présager des évolutions futures et selon l'état de l'art du moment. Or, il semble bien qu'une nouvelle étape est sur le point d'être franchie, si ce n'est pas déjà le cas. A titre personnel, si, à l'époque de rédaction du texte, je n'étais pas en mesure de m'immiscer dans le débat, j'espère, aujourd'hui, pouvoir apporter ma pierre à l'édifice.

Avant d'entrer dans le vif du sujet, je voudrais rappeler, pour mémoire, que cette initiative avait été lancée par le réseau thématiques pluridisciplinaires dédié au document, le RTP-DOC d'où le pseudonyme Roger T. Pédauque pour signer les textes collectifs, placé sous le patronage de feu le département STIC du CNRS. L'objectif était de réfléchir selon une approche pluridisciplinaire à la notion de document dans le contexte des changements induits par le numérique.

Lire la suite...

Structuration RDF XML Causeries Indexation Moteur de recherche OWL TEI Validation XHTML Xquery XSLT —  7 commentaires

RDFaiser votre blog, 2ème partie : la pratique

Dans le précédent billet, j'ai expliqué en quoi RDFa permettait de décrire la structure du message contenu dans une page Web et comment on pourrait facilement générer du RDFa à partir des données structurées dans la base de données de votre CMS. Je vous propose maintenant de passer de la théorie à la pratique.

Ce tutoriel suppose que vous connaissez XHTML et le principe de base de RDF.

Lire la suite...

Structuration RDFa XHTML Geekeries —  14 commentaires

RDFaiser votre blog, 1ère partie : la théorie

HTML, de même que XHTML, permet de structurer une page Web selon les principes d'un langage à balises. Les différentes balises indiquent de manière hiérarchique le rôle joué par chaque portion d'information dans le contexte de la page Web.

Ainsi, la structure d'un document HTML, comme tout document XML, ne décrit pas le contenu/le message de la page Web, mais reflète la structure de la page Web en elle-même. C'est pourquoi il me semble erroné de parler de « sémantisation », lorsqu'on encode en HTML ou, plus généralement, en XML.

Par exemple, soient les deux portions de code HTML suivants :

<div class="contenu">
       <p class="normal">
                Le <a href="http://barcamp.org/SemanticCampParis">SemanticWeb camp</a> se déroule à Paris
                le samedi 16 février 2008 à partir de 9h30.
        </p>
</div>

<div class="description">
         <ul>
                <li>
                        Le <strong>SemanticWeb camp</strong> se déroule à Paris
                        le <em>samedi 16 février 2008 à partir de 9h30</em>.
                </li>
         </ul>
</div>

Ces deux bouts de code HTML ne sont pas identiques du point de vue de la structure, pourtant, du point de vue du contenu, ils délivrent la même information, le même message. Si certains pourraient y voir une limitation de XML, il n'en est rien. Ce n'est tout simplement pas son rôle.


Lire la suite...

Structuration Moteur de recherche RDFa XHTML Geekeries —  2 commentaires

MOAT : donner du sens à vos tags

La folksonomie constitue une des fonctionnalités phare du Web 2.0. Son principe est finalement très simple : permettre aux utilisateurs de décrire des ressources (billet de blog, page Web, photos, vidéos...) par des mots-clés choisis librement. Elle offre, entre autres, les avantages suivants :

  • Améliorer la recherche d'information dans sa collection de ressources personnelles ;
  • Constituer un vecteur de sérendipité ;
  • Donner aux autres utilisateurs une idée du contenu de sa collection de ressources ;
  • Faire apparaître des réseaux sociaux implicites par l'utilisation commune de tags entre différents utilisateurs.

Peu à peu, les utilisateurs se sont pris au jeu et la folie du tagging s'est emparée de tous les internautes et plus simplement des afficionados du Web 2.0.

La folksonomie est devenue un formidable outil dont les possibilités semblent, d'ailleurs, encore largement sous-exploitées. Oui, mais, voilà, la folksonomie est limitée. Le tag n'est finalement qu'une chaîne de caractères dont le sens exact est connu du seul « taggueur » qu'un autre utilisateur peut éventuellement appréhender, mais en aucun cas une machine qui se repose uniquement sur la morphologie du tag pour l'exploiter. Ainsi, la folksonomie présente les désavantages suivants :

Lire la suite...

Web sémantique Folksonomie Geekeries —  1 commentaire