Les petites cases

Quoi de neuf en plus de 140 caractères ?

Il faut affronter les démons et revenir aux choses simples, une vieille habitude sacrifiée sur l'autel des 140 caractères twitteriens, grands vainqueurs de l'immédiateté et de la synthèse sans analyse, la pelote de liens.

Data.gov.uk

Je partage l'avis de Zach Beauvais, platform evangelist chez Talis qu'on ne présente plus depuis que Nicolas les a proclamé « Rois du Web sémantique ». La grande nouvelle de la semaine n'est certainement pas l'Ipad, mais bien l'ouverture en bêta publique du site « data.gov.uk ». Mis au point sous la houlette de Sir Tim Berners-Lee et de Nigel Shadbolt, ce site donne l'accès sous une forme brute aux données/statistiques/informations du secteur publique britannique. Et l'influence des deux comparses se fait sentir dès la page d'accueil : un énorme logo représentant un triplet, une rubrique SPARQL dans le menu principal, et une section « What is the Semantic Web » avec le logo du Web sémantique. Le ton est donné et, contrairement au data.gov américain, les Britanniques ont dès le départ fait le choix des technlogies du Web sémantique. Le site en lui-même a été construit avec Drupal 6 avec du RDFa à l'intérieur, la plupart des donnnées a été convertie en RDF grâce, entre autres, aux bons soins de Jeni Tennison, grande prêtresse du XML et de XSLT convertie au Linked Data, elles sont indexées dans une base de données RDF fournie et hébergée par Talis et, bien-sûr, interrogeable en SPARQL via un sparql endpoint. Le site propose une liste d'applications qui exploitent les données et les mashups entre data.gov et data.gov.uk n'ont pas tardé à apparaître à l'image de celui mis au point par Alvaro Graves. Et si vous vous demandez à l'image de Stefano Mazzochi l'intérêt de RDF pour mettre à disposition des données statistiques, je vous recommande la lecture de ce billet de Jeni Tennison qui fait le bilan de l'expérience « data.gov.uk », insistant, en particulier, sur l'intérêt des technologies du Web sémantique.

Linked Data Triplification Challenge 2010

Le « Linked Data Triplification Challenge 2010 » est lancé. Proposé chaque année par le groupe de recherche AKSW de Leipzig à l'origine de Dbpedia et de triplify, ce concours vise à récompenser les initiatives pour exposer des nouvelles données dans le linked data, faciliter la conversion de données en RDF ou exploiter les données du linked data. Ce concours a déjà provoqué l'émergence et/ou récompensé des projets comme Linked Movie Database, Dbtune.org ou Linked Open Drug Data.

Smob V2

Alexandre Passant a publié la semaine dernière une nouvelle version de Smob, un outil de microbloging sémantique. Cette nouvelle version que j'ai eu la chance de tester en bêta constitue une refondation complète par rapport à la version précédente : plus de distinctions entre Smob server et Smob client, mais une notion de hub, l'interface de saisie est plus conviviale et offre un moyen assez simple pour tagger intelligemment ses twitts (entendez relié à des URIs du Linked data ;-) ), RDFa et SPARQL à tous les étages. Bref, c'est très joli, toujours aussi intéressant et je vais m'empresser de l'utiliser à l'image de la version précédente, d'autant qu'il va être maintenu et on peut espérer voir sortir de nouvelles versions plus régulièrement.

Uberblic.org

Georgi Kobilarov qui fut un des créateurs de Dbpedia vient de lancer Uberblic.org, soit un « service d'intégration de données liées fournissant un point d'accès unique au Web de données ». Cette plate-forme présente deux avantages : la mise à jour en temps réel des données modifiés dans le site d'origine et la possibilité de modifier les mappings et la structure des ontologies utilisés (même si cette dernière n'est pour l'instant accessible qu'à des invités). Plutôt qu'un long discours, je vous invite à consulter cette vidéo qui montre tous les détails. En revanche, la politique des identifiants me laisse songeur, car j'ai l'impression que le service attribue de nouvelles URIs à des ressources qui en possèdent déjà, nous verrons à l'usage, mais cette plate-forme me semble prometteuse et me rappelle un peu ce que sera la prochaine version de Twine.

Sur le front de la standardisation

Du côté du W3C, ça s'agite ferme aussi autour des technologies du Web sémantique. Le groupe de travail SPARQL continue sa marche forcée vers SPARQL 1.1 et fournit une mise à jour de 6 recommandations toutes aussi intéressantes les unes que les autres (je conseille en particulier SPARQL Update et SPARQL Uniform HTTP Protocol for Managing RDF Graphs) et offre à la lecture une nouvelle recommandation : SPARQL 1.1 property paths, soit une syntaxe de navigation dans le graphe.

Mais, la grande annonce concerne RDF et la tenue au mois de juin d'un workshop sur son avenir. Cette annonce avait été précédée au mois de novembre par un thread sur la liste Semantic Web du W3C constituant une liste de souhait sur RDF 2 et a été suivie par de nombreuses réactions à commencer par deux threads toujours sur la même liste : Requirements for a possible "RDF 2.0" et RDF syntaxes 2.0. Sur le même sujet, je vous conseille ausssi la lecture de ce billet de Dave Beckett, développeur de redland, inventeur de turtle et grand avocat des technologies du Web sémantique.

RDF Sparql Causeries Linked Data — 

Commentaires

Cool ! Pas mal de liens que j'avais manqué :) Sinon effectivement data.gov.uk s'est relativement une belle claque, j'attends les premières visualisations avec impatience.

Je suis vraiment contente qu'il y ait un site Web où les statistiques du gouvernement seront partagés avec le public. Le gouvernement a toujours été très discret quand il s'agit de partager leur date, mais maintenant, prenant exemple sur les États-Unis, ils sont maintenant le partage des données du secteur public d'une manière qui le rend beaucoup plus facile pour les gens à trouver. D'ailleurs, je suis heureux qu'il existe de nombreux autres sites comme http://www.videorolls.com/watch/UK-House-Prices-powered-by-data-gov-uk-o... celui-ci alimenté par data.gov.uk aider les gens à obtenir de l'information vraie.