Les petites cases

Le Web sémantique rencontre....

Preuve de la maturité des technologies et des standards du Web sémantique, les chercheurs et promoteurs du domaine vont à la rencontre d'autres communautés pour leur proposer de nouvelles applications, des idées, des tutoriaux, leurs expertises... Bref, des rencontres se produisent qui amènent des projets qui montrent chaque jour un peu plus la pertinence du modèle. Voici une petite sélection repérée ces derniers jours.

Le semWeb rencontre les catalogues de bibliothèques

Comme tout le monde, je suis allé voir le projet Open Library lancé par Internet Archive. Quel ne fut pas ma déception de voir qu'il n'y avait dans le projet aucune réflexion autour de la modélisation des oeuvres avec FRBR, pas de notion d'autorités, aucune relation entre les ouvrages... Bref, un bon vieux catalogue à la papa avec un formulaire de saisie bien rebutant. Quand on voit des initiatives comme Freebase (qui vient d'ouvrir à tous, je vous conseille la visite) ou des sites comme Library thing, comment peut-on encore faire des interfaces pareilles, sans même parler de Web sémantique ? Heureusement, Frédérik Giasson qui est un des développeurs de la Bibliographic ontology a pris le taureau par les cornes (pas comme moi, qui me contente de jouer à l'utilisateur grincheux...) et a contacté les promoteurs du projet pour transformer leurs données en RDF et les exposer via un Sparql endpoint. Me voilà ravi et un pas de plus entre le Web sémantique et les bibliothèques, dont la rencontre ne peut être que naturelle.

Le SemWeb rencontre les vocabulaires contrôlés

Plus qu'une rencontre, ce couple s'apparente plus à des parents. A l'occasion de DC 2007 qui aura lieu la semaine prochaine, Alistaire Miles fera un tutoriel sur les vocabulaires contrôlés dont le diaporama est déjà disponible : objectifs, retour sur investissement, construction, comparaison avec les folksonomies, publication, "skosification", extraction et alignement. Tout y est et c'est très intéressant.

Le SemWeb rencontre le multimédia

Le W3C multimedia Semantics incubator group a publié une série de rapports faisant le point sur les normes et leurs équivalents existants en RDF/OWL pour décrire des objets multimédias (son, image, vidéo). Tout y passe : EXIF, MPEG 7... Cela pourra certainement vous donner des idées pour décrire vos objets en RDF.

Le SemWeb rencontre les utilisateurs d'Excel

La syntaxe RDF/XML vous rebute, vous ne comprenez rien à Turtle ou N-Triples, mais vous êtes convaincu de l'intérêt de RDF et vous avez une pléthore de fichier excel à convertir, alors RDF123 est fait pour vous. Ce logiciel transforme les données d'un tableur en RDF et a été mis au point par Ebiquity group, déjà à l'origine de Swoogle, le moteur de recherche du Web sémantique.

Le SemWeb rencontre les moteurs de recherche

Henry Story de Sun explique dans ce billet que les requêtes des utilisateurs sur le moteur de recherche Altavista (j'avoue que je ne savais pas qu'Altavista existait toujours...) sont transformées en requête SPARQL dont les réponses au format XML ad-hoc sont transformés en XSL. Si j'ai bien compris l'intérêt de la méthode (mais je suis pas bien sûr sur ce coup-là), cela laisse entrevoir la possibilité de rendre transparent un formulaire Web pour une machine via sa modélisation en SPARQL. Cela signifie aussi qu'on pourrait interroger le moteur via le protocole Sparql et si on étendait la méthode à tous les moteurs, oui, on obtiendrait un protocole unique pour interroger tous les moteurs. Et, ensuite, on pourrait relier les réponses avec les entrepôts RDF et puis.... Ho !! là, je m'emballe, désolé...

Et, pour finir, si vous vous demandez encore ce qu'est le Web sémantique, son intérêt et vous y retrouvez entre RDF, OWL, RDFa, SPARQL et autres, je vous conseille cette introduction au Web sémantique signée Ivan Herman du W3C faite à l'occasion de DC 2007.

Et, si après tout cela, vous n'êtes pas encore convaincu que ça avance peu à peu et que le Web sémantique mérite votre attention, je ne sais que faire de plus ;-) Bonne lecture.

Management de l'information RDF Web sémantique Sparql Causeries Folksonomie Moteur de recherche OWL RDFa — 

Commentaires

Bonjour Got,
Merci pour ce billet faisant le lien entre le SW et quelques notions bien connues par le monde de l'IST. Je suis particulièrement intéressé par la partie sur SW et les le monde des tableurs (nous le savons tous, le monde des tableur est très souvant sous utilisé, surtout en relation avec le monde des bases de données relationnelles). J'avais pensé, il y a quelques semaines me lancer dans le création d'un outil permettant d'utiliser le tableau l'Open Office pour générer du RDF. Cette info tombe donc à point. Finalement, un bon tableur bien utiliser vaudrait-il un éditeur XML parfois coûteux ?

Bien à toi,
Stéphane.
Cela dépend toujours de la granularité de ton fichier XML, si la granularité de ton arbre XML est de 2 voire 3, un tableau est effectivement une bonne solution, simple qui ressemble d'ailleurs à certaines interfaces d'éditeur XML comme XMLspy ou XMetal (qui sont effectivement très chers). En revanche, au-delà, c'est totalement inadapté, or quand tu encodes un texte en général et une source en particulier, la granularité peut être très importante, dans ce cas, je ne connais pas de solutions miracles si ce n'est un éditeur XML (certains ne sont pas si chers, XML oxygen pour ne pas le citer) ou éventuellement un traitement de texte pour les macro-structures et un éditeur XML pour le détail.