Les petites cases

Outils

Les carcans de la pensée hiérarchique et documentaire (1)

Dans un billet intitulé « Comment organiser l'information pour y naviguer efficacement », j'essayais d'analyser en quoi l'organisation hiérarchique de l'information, issue des pratiques d'organisation physique de l'information, que ce soit dans un livre-codex ou sur un système de fichiers, influençait notre pratique du Web et comment, peu à peu, l'hypertexte et certaines pratiques, alors naissantes, comme la folksonomie ou la multiplication des métadonnées pouvaient permettre de dépasser ce paradigme pour démultiplier les accès à l'information et donc son exploitation. Je vous propose de revenir sur ces questions pour comprendre en quoi il est nécessaire aujourd'hui pour appréhender au mieux les enjeux du Web de données de s'abstraire de ce paradigme pour aller vers un nouveau modèle d'organisation et de modélisation de l'information.

Lire la suite...

Structuration Web sémantique XML Système d'information Causeries Histoire —  11 commentaires

Les professionnels de l'information face aux défis du Web de données

Dans le prolongement de mon billet de la semaine dernière, je choisis une nouvelle fois la solution de facilité en vous proposant le diaporama de la communication effectuée dans le cadre de la journée d'études organisée le 7 avril 2009 par l'ADBS et l'EDB intitulée "Quel Web demain ?".

Public différent, traitement différent (mais sujet quasi-identique ;-) ) : l'objectif était ici de présenter aux professionnels de l'information le Web de données et le rôle qu'ils pourraient jouer dans le contexte de cette nouvelle étape de l'édification du Web, d'où le titre : « les professionnels de l'information face aux défis du Web de données ». Cette communication a été l'occasion de définir pour la première fois un sujet qui m'occupe en ce moment, à savoir, l'architecture de données, qui me semble ouvrir des perspectives intéressantes dans la construction des systèmes d'information.

Bonne lecture !

Lire la suite...

Management de l'information Web sémantique Système d'information Causeries —  2 commentaires

Limites du modèle relationnel et Web sémantique

Non ! ce blog n'est pas mort comme tant d'autres, mais je ne trouve tout simplement pas le temps de bloguer en ce moment. Pourtant, ce n'est pas les sujets qui manquent, d'autant que chaque jour nous apporte son lot de bonne nouvelle sur le front du Web sémantique.

Pour me faire pardonner et vous faire patienter, je vous propose le diaporama d'une communication que j'ai faite avec mon excellent collègue, Alexandre Bertails, alias betehess, alias l'homme qui résout les sudokus avec OWL, alias l'homme qui murmure à l'oreille de Pellet, à l'occasion de la conférence "Web version 2 et suivantes" dans le cadre de Solution Linux. L'objectif de cette présentation était de montrer en quoi les technologies du Web sémantique constituent des réponses à certaines limites du modèle des bases de données relationnelles et donc en quoi elles peuvent avoir leur place dans les systèmes d'information traditionnelles. Je pense que certains lecteurs de ce blog pourront ainsi mieux se rendre compte de l'apport des technologies du Web sémantique pour la gestion des données structurées.

Bonne lecture !

Lire la suite...

RDF Système d'information Sparql OWL Geekeries Linked Data —  12 commentaires

Migration de ce site de Drupal 5 à Drupal 6

Pour des raisons que vous comprendrez bientôt (reprenons la mauvaise habitude du teasing ;-) ), il m'a fallu migrer ce site de Drupal 5 à Drupal 6. A la demande de Charles, je vous propose dans ce billet un compte-rendu de cette expérience.

Pour commencer, il faut suivre pas à pas et strictement les étapes décrites dans le fichier UPGRADE.txt disponible dans l'archive de Drupal 6. Si vous vous ne sentez pas après cette lecture, vous pouvez consulter ce screencast très complet qui décrit la procédure de migration.

Lire la suite...

Outils Geekeries —  1 commentaire

Yahoo apporte des bananes au Web sémantique, 1ère partie

Annoncé, il y un peu plus de 2 mois, « l’écosystème de développement pour la recherche » de Yahoo est maintenant disponible sous le nom de SearchMonkey. Si, avec cette initiative, le but de Yahoo était de reprendre la main sur Google dans le domaine strict de la recherche, il me semble qu’une partie du chemin a été effectuée. Plutôt, que d’attaquer frontalement Google en mettant en œuvre de nouveaux algorithmes de recherche, par exemple, Yahoo a choisi un angle différent jusqu’alors complètement inexploité et, pourtant, oh ! combien important, à savoir la présentation des résultats.

Et, dans ce cadre, aiguillé certainement par le succès de facebook et de sa plate-forme de développement ouvert, le moteur de recherche a mis à disposition des développeurs une plate-forme pour mettre au point des applications qui agrémentent, selon la volonté des utilisateurs, les résultats de la recherche. Pour ce faire, il rend disponible les données de son index, soit les données structurées avec des microformats, RDFa et eRDF (embeded RDF, un système à peu près équivalent à RDFa) et déjà indexées, par défaut, par Yahoo, soit directement l’ensemble des données de la page Web à partir desquelles le développeur peut créer une extraction personnelle.

La plate-forme SearchMonkey comprend donc trois parties (et donc trois billets pour le présenter…) :

  • Une à destination des utilisateurs ;
  • Une à destination des développeurs ;
  • Une à destination des propriétaires de sites.

Lire la suite...

Causeries Indexation Moteur de recherche RDFa —  9 commentaires

Smob : le Twitter version Web sémantique

Tukka Hastrup, Uldis Bojars, John Breslin et l’inévitable Alexandre Passant ont mis au point Smob, un système de micoblogging décentralisé basé sur les technologies du Web sémantique, en particulier SIOC, choix logique quand on sait que les quatre développeurs en sont des contributeurs actifs. Cette application démontre parfaitement en quoi les technologies du Web sémantique vont offrir aux utilisateurs (pour ne pas dire « utilisacteurs ») un meilleur contrôle de leurs données dans le cadre de l’écosystème mis en place par le Web 2.0.

Lire la suite...

Management de l'information Web sémantique Blog Geekeries —  7 commentaires

Du Web sémantique au web de données, 2ème partie : retour sur un des articles de Roger T. Pédauque

Dans un billet récent écrit à l'occasion des dix ans de XML, Jean-Michel Salaün regrettait que les pistes esquissés dans le second texte de l'initiative Roger T. Pédauque intitulé «  Le texte en jeu. Permanences et transformations du document  » n'aient pas été suivies. Et, pour cause me semble-t-il, si ce deuxième article, comme les deux autres d'ailleurs, apporte incontestablement des pistes de réflexion et certaines idées intéressantes, il comprend des contre-sens et des erreurs si manifestes qu'il n'est possible de s'en servir comme base de travail qu'après une critique attentive, sans compter sur le style que Jean-Michel Salaün lui-même dans le billet cité plus haut qualifie « d'un peu abscons » et que je qualifierais plus volontiers de charabia jargonnant.

A l'heure où le Web sémantique pointe avec plus de prégnance le bout de son nez, il n'est pas inutile de revenir sur ce texte, comme sur les deux autres, pour construire une nouvelle réflexion. C'était d'ailleurs leur but : susciter le débat et la réflexion, sans présager des évolutions futures et selon l'état de l'art du moment. Or, il semble bien qu'une nouvelle étape est sur le point d'être franchie, si ce n'est pas déjà le cas. A titre personnel, si, à l'époque de rédaction du texte, je n'étais pas en mesure de m'immiscer dans le débat, j'espère, aujourd'hui, pouvoir apporter ma pierre à l'édifice.

Avant d'entrer dans le vif du sujet, je voudrais rappeler, pour mémoire, que cette initiative avait été lancée par le réseau thématiques pluridisciplinaires dédié au document, le RTP-DOC d'où le pseudonyme Roger T. Pédauque pour signer les textes collectifs, placé sous le patronage de feu le département STIC du CNRS. L'objectif était de réfléchir selon une approche pluridisciplinaire à la notion de document dans le contexte des changements induits par le numérique.

Lire la suite...

Structuration RDF XML Causeries Indexation Moteur de recherche OWL TEI Validation XHTML Xquery XSLT —  7 commentaires

RDFaiser votre blog, 1ère partie : la théorie

HTML, de même que XHTML, permet de structurer une page Web selon les principes d'un langage à balises. Les différentes balises indiquent de manière hiérarchique le rôle joué par chaque portion d'information dans le contexte de la page Web.

Ainsi, la structure d'un document HTML, comme tout document XML, ne décrit pas le contenu/le message de la page Web, mais reflète la structure de la page Web en elle-même. C'est pourquoi il me semble erroné de parler de « sémantisation », lorsqu'on encode en HTML ou, plus généralement, en XML.

Par exemple, soient les deux portions de code HTML suivants :

<div class="contenu">
       <p class="normal">
                Le <a href="http://barcamp.org/SemanticCampParis">SemanticWeb camp</a> se déroule à Paris
                le samedi 16 février 2008 à partir de 9h30.
        </p>
</div>

<div class="description">
         <ul>
                <li>
                        Le <strong>SemanticWeb camp</strong> se déroule à Paris
                        le <em>samedi 16 février 2008 à partir de 9h30</em>.
                </li>
         </ul>
</div>

Ces deux bouts de code HTML ne sont pas identiques du point de vue de la structure, pourtant, du point de vue du contenu, ils délivrent la même information, le même message. Si certains pourraient y voir une limitation de XML, il n'en est rien. Ce n'est tout simplement pas son rôle.


Lire la suite...

Structuration Moteur de recherche RDFa XHTML Geekeries —  2 commentaires

Google se met à FOAF

Alors que j'expliquais dans mon précédent billet en quoi FOAF constituait une réponse aux problèmes de contrôle des données personnelles et d'interopérabilité entre les services de réseaux sociaux, Google semble me donner raison avec la sortie d'une nouvelle API : Social graph API. Si Google a longtemps traîné des pieds avant de s'intéresser aux technologies du Web sémantique, nous étions beaucoup à penser qu'il ne leur faudrait pas énormément de temps le jour où il voudrait s'y mettre. Il semble que ce jour soit arrivé.

Qu'en est-il exactement ?

Pour faire simple, Social Graph API permet d'effectuer des requêtes sur les données indexées par Google et encodées avec FOAF, XFN (pour faire vite, l'équivalent de FOAF avec les microformats) et les profils publics de certains services comme MySpace. Grâce à cette API, vous pouvez, par exemple, retrouver les différentes personnes qui sont liées à vous par l'intermédiaire d'un FOAF ou d'un XFN, concaténer en un point unique les informations éparpillées entre vos différentes pages de profils des services auxquels vous êtes abonnés (cf. l'exemple de Plaxo Pulse)...

Lire la suite...

Web sémantique Causeries Indexation Moteur de recherche —  9 commentaires

FOAF : le réseau social garanti sans pub !

Vous en avez marre des pubs intempestives de Facebook, vous n'arrivez plus à gérer à la fois vos profils sur Linked in et Viadeo, vous vous dites que Google a suffisamment d'informations sur vous pour ouvrir un compte sur Orkut et vous voulez garder l'entière maîtrise des informations en ligne vous concernant, car vous êtes néanmoins convaincu qu'une présence en ligne est essentielle. Alors, n'attendez plus, créez votre fichier FOAF, mettez le en ligne et participez à la construction du graphe global géant. Cerise sur le gâteau, vous disposerez avec SPARQL d'une API standard réellement ouverte pour accéder aux données, contrairement à d'autres...

Vous allez me dire que je vous ai déjà fait le coup, il y a deux ans et que FOAF n'a pas constitué la première brique annoncée du Web sémantique. Alors, qu'est-ce-qui a changé pour justifier un regain d'intérêt pour FOAF ?

Premièrement, les technologies, nous disposons de nombreuses implémentations qui commencent à devenir matures de RDF et de SPARQL dans différents langages : PHP, Java et autres... et des frameworks pour construire simplement des triples store RDF sont disponibles.

Deuxièmement, les données disponibles en RDF, cette année a été très riche dans la mise à disposition de données en RDF : geonames, Dbpedia, revyu... L'initiative « Linked data » a permis d'accélérer le mouvement pour la création du Web sémantique ou, plutôt, du Web of data et l'appropriation des technologies sous-jancentes.

Troisièmement, la montée en puissance des réseaux sociaux est indéniablement le principal argument qui plaide en faveur de FOAF. Les usages sont peu à peu apparus, mais aussi les limites. Les utilisateurs prennent peu à peu conscience des dangers que représentent la mise à disposition de leurs données personnelles dans des services centralisés dont le modèle économique repose presque exclusivement sur la publicité.

Lire la suite...

Web sémantique Blog Geekeries —  21 commentaires