Les petites cases

Web sémantique

Comprendre RDF en moins de cinq minutes

Dans le prolongement de mes billets RDF pour les nuls et A la découverte du Web sémantique, je vous propose de découvrir RDF en cinq minutes à travers quelques slides créés pour des formations au Web sémantique, que j'ai données ces dernières semaines.

Il faudrait que je l'accompagne de l'explication de texte, mais le temps me manque... Il faudra donc s'en contenter ou vous référer aux différents billets de ce blog sur la question.

PS : pour s'amuser, on fait un concours avec Manue : celui qui aura le plus de hit sur un diaporama sur son sujet favori. Alors, cliquez ! ;-)

Lire la suite...

Structuration RDF XML Geekeries —  4 commentaires

ISWC 2008 : premières impressions générales

J'ai la chance d'assister depuis hier à la conférence internationale annuelle sur le Web sémantique (ISWC) qui a lieu cette année à Karlsruhe, pour, entre autres, en compagnie de Manue, présenter, sous forme d'un poster, comment nous utilisons les technologies du Web sémantique dans le cadre du système de conservation du document numérique de la BnF (SPAR) que développe, en ce moment, Atos Origin.

C'est évidemment une excellente occasion pour prendre le pouls du Web sémantique et de sa communauté, de rencontrer toutes les personnes que je suis ou avec qui je suis en contact sur le Web (la liste serait trop longue, vous vous reconnaitrez ;-) ) et d'avoir des discussions passionnantes au grés des rencontres (merci à tous !).

Lire la suite...

Web sémantique Causeries —  4 commentaires

Ubiquity + SparqlBot = le Web sémantique pour tous

C’est à une rencontre programmée que je vous convie ce soir, vous savez ces rendez-vous arrangés dont on est sûr et certain de l’issue, la rencontre d’Ubiquity et de Sparqlbot.

Commençons par la présentation de nos deux protagonistes :

  • D’un côté, Ubiquity, une belle extension Firefox pleine d’avenir déjà très sexy sortie tout droit des cerveaux de la Mozilla labs, permet d’effectuer simplement des requêtes sur des services en ligne directement depuis n’importe quelle page Web via des pseudos lignes de commande pré-programmées.
  • De l’autre, SparqlBot, un petit agent logiciel un peu geeky mis au point par Benjamin Nowack qui ne demande qu’à s’épanouir et à voler vers des horizons moins circonscrits, permet d’obtenir des réponses à des questions en utilisant les données exposés sur le Web avec les technologies du Web sémantique selon les principes du Linked data via des pseudo-lignes de commandes pré-programmées.

Comme vous le pouvez le constater par vous-mêmes, leurs points communs étaient trop flagrants pour ne pas les faire se rencontrer. C’est justement ce que vient de faire Benjamin Nowack, en mettant à disposition une commande Ubiquity qui permet d’interroger SparqlBot et de recevoir la réponse sous la forme d’une petite pop-up qui s’affiche en haut de la page Web.

Lire la suite...

Sparql Geekeries Linked Data —  4 commentaires

Où s'amuser avec Sparql ?

Non, il ne s'agit pas de faire un guide des parcs parisiens les plus accueillants pour votre nouveau compagnon à quatre pattes que vous auriez malicieusement appelé du nom de la recommandation la plus importante du W3C depuis XML, mais plutôt une liste non exhaustive des Sparql endpoint que vous pouvez interroger librement sur le Web. Les différentes interfaces que je vais présenter sont mis à disposition dans le cadre du projet Linking Open Data (ou LOD) coordonné par le W3C.

Ce projet vise à exposer sur le Web des données structurées avec les technologies du Web sémantique, en particulier RDF et Sparql, suivant les quatre principes du Linked Data édictés par Tim Berners-Lee et rappelés dans ce guide ou cette présentation, soit :

  • Attribuer une URI à chaque chose/ressource ;
  • Utiliser des URIs HTTP, c'est à dire déférençable, pour que les personnes puissent consulter facilement et directement ces choses/ressources ;
  • Si quelqu'un veut accéder à cette URI, fournir les informations utiles en utilisant le modèle RDF ;
  • Inclure des assertions RDF qui relient à d'autres URIs, pour qu'ils puissent découvrir les choses/ressources reliés.

Lire la suite...

Sparql Geekeries Linked Data —  6 commentaires

Knowledge box reloaded

Il y a un peu plus d'un an, dans le but de montrer les possibilités des technologies du Web sémantique, en particulier RDFa, j'avais mis au point une petite application, la knowledge box, qui donnait la définition récupérée depuis Dbpedia de termes encodées en RDFa avec la propriété owl:sameAs et une URI de Dbpedia. Cette première version relevant de la bidouille, il était difficile de récupérer le code pour l'intégrer dans un autre site sous Drupal ou d'autres CMS.

La mise à disposition par Arto Bendiken d'une première version (Alpha ! attention donc en production) des modules RDF API et SPARQL pour Drupal 6 m'a permis d'améliorer le code de la knowledge box et d'en faire un vrai module drupal. Pour les (heureux !) utilisateurs de Drupal 6, il vous suffit donc de récupérer l'archive et de décompresser les fichiers dans le répertoire Modules.

Lire la suite...

Sparql RDFa Geekeries —  4 commentaires

Yahoo apporte des bananes au Web sémantique, 1ère partie

Annoncé, il y un peu plus de 2 mois, « l’écosystème de développement pour la recherche » de Yahoo est maintenant disponible sous le nom de SearchMonkey. Si, avec cette initiative, le but de Yahoo était de reprendre la main sur Google dans le domaine strict de la recherche, il me semble qu’une partie du chemin a été effectuée. Plutôt, que d’attaquer frontalement Google en mettant en œuvre de nouveaux algorithmes de recherche, par exemple, Yahoo a choisi un angle différent jusqu’alors complètement inexploité et, pourtant, oh ! combien important, à savoir la présentation des résultats.

Et, dans ce cadre, aiguillé certainement par le succès de facebook et de sa plate-forme de développement ouvert, le moteur de recherche a mis à disposition des développeurs une plate-forme pour mettre au point des applications qui agrémentent, selon la volonté des utilisateurs, les résultats de la recherche. Pour ce faire, il rend disponible les données de son index, soit les données structurées avec des microformats, RDFa et eRDF (embeded RDF, un système à peu près équivalent à RDFa) et déjà indexées, par défaut, par Yahoo, soit directement l’ensemble des données de la page Web à partir desquelles le développeur peut créer une extraction personnelle.

La plate-forme SearchMonkey comprend donc trois parties (et donc trois billets pour le présenter…) :

  • Une à destination des utilisateurs ;
  • Une à destination des développeurs ;
  • Une à destination des propriétaires de sites.

Lire la suite...

Causeries Indexation Moteur de recherche RDFa —  9 commentaires

RDFaiser votre blog, 3ème partie : l’exploitation

Si HTML permet de structurer une page Web dans une visée documentaire, RDFa permet d’en structurer, de manière indépendante, les données. Au final, RDFa ajoute donc une troisième couche aux deux existantes :

  • HTML pour structurer la page Web ;
  • CSS pour structurer la mise en forme de la page Web ;
  • RDFa pour structurer les données de la page Web.

Il est difficile de prévoir aujourd’hui tous les usages possibles de RDFa ; ils restent encore largement à inventer. En effet, et c’est le propre et l’intérêt des technologies du Web sémantique, la modélisation des données en RDF est indépendante des usages qui en sont faits. Malgré tout, il est d’ors et déjà possible d’identifier quelques usages.

Lire la suite...

Causeries RDFa —  7 commentaires

Smob : le Twitter version Web sémantique

Tukka Hastrup, Uldis Bojars, John Breslin et l’inévitable Alexandre Passant ont mis au point Smob, un système de micoblogging décentralisé basé sur les technologies du Web sémantique, en particulier SIOC, choix logique quand on sait que les quatre développeurs en sont des contributeurs actifs. Cette application démontre parfaitement en quoi les technologies du Web sémantique vont offrir aux utilisateurs (pour ne pas dire « utilisacteurs ») un meilleur contrôle de leurs données dans le cadre de l’écosystème mis en place par le Web 2.0.

Lire la suite...

Management de l'information Web sémantique Blog Geekeries —  7 commentaires

A la découverte du Web sémantique et de ses technologies

Pour vous faire patienter avant que ce blog ne reprenne un rythme normal de publication (d'ici un mois ou deux...), je vous propose une présentation du Web sémantique et de ses technologies sous la forme d'un diaporama. Il a été mis au point pour présenter le sujet à mes nouveaux collègues. J'espère qu'il pourra vous aider à mieux comprendre les buts poursuivis par le Web sémantique et ses technologies.

Bonne lecture et à bientôt !

Lire la suite...

Web sémantique Geekeries —  15 commentaires

Du Web sémantique au web de données, 2ème partie : retour sur un des articles de Roger T. Pédauque

Dans un billet récent écrit à l'occasion des dix ans de XML, Jean-Michel Salaün regrettait que les pistes esquissés dans le second texte de l'initiative Roger T. Pédauque intitulé «  Le texte en jeu. Permanences et transformations du document  » n'aient pas été suivies. Et, pour cause me semble-t-il, si ce deuxième article, comme les deux autres d'ailleurs, apporte incontestablement des pistes de réflexion et certaines idées intéressantes, il comprend des contre-sens et des erreurs si manifestes qu'il n'est possible de s'en servir comme base de travail qu'après une critique attentive, sans compter sur le style que Jean-Michel Salaün lui-même dans le billet cité plus haut qualifie « d'un peu abscons » et que je qualifierais plus volontiers de charabia jargonnant.

A l'heure où le Web sémantique pointe avec plus de prégnance le bout de son nez, il n'est pas inutile de revenir sur ce texte, comme sur les deux autres, pour construire une nouvelle réflexion. C'était d'ailleurs leur but : susciter le débat et la réflexion, sans présager des évolutions futures et selon l'état de l'art du moment. Or, il semble bien qu'une nouvelle étape est sur le point d'être franchie, si ce n'est pas déjà le cas. A titre personnel, si, à l'époque de rédaction du texte, je n'étais pas en mesure de m'immiscer dans le débat, j'espère, aujourd'hui, pouvoir apporter ma pierre à l'édifice.

Avant d'entrer dans le vif du sujet, je voudrais rappeler, pour mémoire, que cette initiative avait été lancée par le réseau thématiques pluridisciplinaires dédié au document, le RTP-DOC d'où le pseudonyme Roger T. Pédauque pour signer les textes collectifs, placé sous le patronage de feu le département STIC du CNRS. L'objectif était de réfléchir selon une approche pluridisciplinaire à la notion de document dans le contexte des changements induits par le numérique.

Lire la suite...

Structuration RDF XML Causeries Indexation Moteur de recherche OWL TEI Validation XHTML Xquery XSLT —  7 commentaires