Les petites cases

Et à part ça ? Encore pleins de choses...

Parce qu'il n'y a pas que Facebook dans la vie et que ce début de printemps fut réellement un grand cru dans le domaine des technologies du Web sémantique, je vous propose une pelote/gazette spéciale "printemps".

Comprendre simplement les technologies du Web sémantique

Et, on commence par le très bon documentaire de Kate Ray intitulé « Web 3.0 ». A travers différents interviews (Tim Berners-Lee, Lee Feigenbaum, Nova Spivack, Clay Shirky pour n'en citer que quelques uns), Kate Ray dresse en 14 minutes un panorama des problématiques, débats et enjeux de l'utilisation des données structurées pour la recherche d'informations et le Web de demain et le rôle du Web sémantique. Évidemment, Clay Shirky (il n'est pas le seul) nous gratifie de sa position habituelle à savoir que le Web Sémantique cherche à imposer une vision du monde par une organisation unique. Quant aux ontologistes, leurs réactions sont tout aussi risibles, lorsqu'une personne suite à une table ronde (qui semble avoir lieu à ISWC 2009) posent la question de la pertinence de l'ontologie... Les deux camps sont comme d'habitude aussi caricaturaux l'un que l'autre. Le documentaire se finit sur la position sage et prudente de Tim Berners-Lee qui refuse de donner son avis sur l'avenir du Web, égal à lui-même.
De mon point de vue, ce documentaire montre une chose essentielle : l'avenir de la gestion de l'information et de la recherche sur le Web passe d'une manière ou d'une autre par les données structurées (et donc au moins pour une partie par les technologies du Web sémantique). Dire qu'on nous annonçait, il y a peu encore, le règne sans partage du texte intégral et de l'algorithme-roi et qu'on raillait allègrement les personnes qui continuaient de clamer l'importance des données structurées, ce renversement de tendances m'amuse beaucoup et me ravit (quoi ? je suis mesquin ? Non ? vous croyez... Peut-être, alors...)
Est-ce-que quelqu'un dans la salle aurait le temps et l'amabilité de faire une petite traduction ? Ce serait, à mon avis, un travail d'intérêt public. Merci d'avance à elle !

Toujours dans le domaine de la vulgarisation, je vous conseille la lecture de cette article sur Usinenouvelle.com : « L'industrie s'empare du Web sémantique ». Les bons articles de vulgarisation sur le sujet dans la presse informatique sont rares, celui-ci en est un. Il présente à la fois des cas d'utilisation concrets, les technologies et les recherches dans le domaine et propose un encadré salutaire intitulé : « La recherche sémantique n'existe pas... encore ». Saine lecture encouragée et à encourager.

Lire la suite...

Web sémantique Causeries —  1 commentaire

Open Graph Protocol : Facebook se met au Web sémantique ?

Retour le 21 avril au soir : Facebook organise l'événement F8 au cours duquel il va annoncer les évolutions de sa plate-forme à destination des développeurs. A titre personnel, je n'ai pas vu l'annonce dont je n'ai a priori rien à attendre. Un premier twitt de Nicolas attire mon œil :

« Mark Zuckerberg - 3 fois le mot semantic par phrase.. des graphs dans tous les sens avec des connections avec d'autres sites. hmm.. »

Attiré, certes, mais sans grand espoir, je continue à vaquer à mes occupations numériques. Quelques minutes plus tard, première annonce concrète, Facebook met à disposition une « Graph API ». Alors que Régis a l'air enthousiaste, je partage la déception de Nicolas :

« Facebook propose une "Graph API" mais le format = JSON, les bras m'en tombent... http://graph.facebook.com/ via @rgaidot et @cyno »

Ce dernier essaye de me faire voir le bon côté des choses. Il a raison car les annonces ne sont pas terminées et quelques minutes plus tard, Manu Sporny relance nos espoirs en attirant l'attention sur un header de page HTML avec un encodage RDFa montré lors de la conférence :

« I think Facebook just announced RDFa support (the Open Graph Protocol) at F8: http://ow.ly/1Bm2g #rdfa #html5 #f8 (look at the attributes) »

Les soupçons sont rapidement confirmés, Facebook annonce Open Graph Protocol, un vocabulaire RDF très simple pour encoder en RDFa le titre de la page, le type de ressource décrite (vidéo, sport, entreprise, hôtel...), le titre du conteneur de la page et l'URL d'une image (et quelques autres choses..). Dans la foulée, Facebook annonce le support de ce protocole par plusieurs sites importants : IMDB, Microsoft, NHL, Posterous, Rotten Tomatoes...

Lire la suite...

Web Causeries Indexation RDFa Linked Data — 

RDFa 1.1 pour corriger les erreurs de jeunesse ?

RDFa est devenu, depuis plus d'un an, un des enjeux des batailles qui se nouent autour de HTML 5. Au cœur de la polémique, c'est ni plus ni moins que l'intégration de RDFa dans HTML 5 qui est en jeu, face au Microdata, principe concurrent proposé par Ian Hickson, un des éditeurs de HTML 5. Je ne vais pas revenir sur les débats qui agitent les spécialistes de la question, d'autant que si certains arguments sont recevables, il en est d'autres qui relèvent plus du combat d'ego. Face aux polémiques qui n'en finissaient plus d'enfler, aux retours des implémenteurs et à l'enjeu que revêtait RDFa suite aux différentes annonces effectués par Yahoo (SearchMonkey) et Google (Rich Snippets) pour ne citer qu'eux, le W3C a décidé de relancer le groupe de travail RDFa au mois de janvier 2010.

Lire la suite...

Structuration RDFa XHTML Geekeries —  1 commentaire

Vous avez dit « format pérenne » ?

Avant de poursuivre, j'aimerais revenir sur la question du format, en particulier tordre le cou à l'idée de « format pérenne ». Cela ne veut strictement rien dire. Aucun format n'est pérenne, car il est impossible d'imaginer toutes les évolutions possibles. Il est vrai, en revanche, que certains formats de par leurs caractéristiques sont plus simples à gérer sur le long terme que d'autres.

Lire la suite...

Management de l'information Râleries —  2 commentaires

Quelques considérations sur la notion de collection

Dans mon précédent billet, discutant l'expression « digital preservation », j'ai essayé de poser les bases de la gestion de l'information numérique pour en garantir la communication sur le long terme. J'ai ainsi cherché à démontrer que les tâches à effectuer pour l'information numérique ne différaient finalement pas de celles effectuées pour l'information sur le support traditionnel.

Dans ce billet, je voudrais faire quelques remarques sur la notion de collection (Amis, archivistes, j'espère que vous ne m'en voudrez pas d'avoir choisi cette terminologie, vous connaissez mon atavisme pour les bibliothèques ;-) ).

Lire la suite...

Management de l'information Système d'information Causeries —  2 commentaires

L'expression « digital preservation » est-elle pertinente ?

Deux ans que je travaille sur un projet pour mettre en place un « système de préservation » et, finalement, j'en viens à me poser cette question toute simple : l'expression « digital preservation » (traduite par le néologisme « préservation numérique ») est-elle pertinente ?
Rien n'est moins sûr quand je dresse le bilan du travail accompli, je dirais même que cette expression est l'arbre qui cache la forêt. Au final, j'ai l'impression qu'elle a fait croire que le problème se résoudrait par des moyens ou des compétences techniques, alors qu'il n'en est rien, les actions des futurs conservateurs/gestionnaires de collection numérique seront bien les mêmes que leurs collègues qui s'occupent des collections traditionnelles, ce sont les outils et les connaissances qui diffèrent et non les compétences.

Lire la suite...

Management de l'information Système d'information Causeries —  8 commentaires

La gazette du Web de données (1er trimestre 2010)

Un petit trimestre est passé depuis mon billet-pelote en forme de thérapie d'écriture. A part sur ce blog, il s'est passé plein de choses et comme plusieurs d'entre vous m'ont fait part de leur intérêt pour ce type de billets, je vous propose une sélection toute personnelle des derniers potins, nouveautés, rumeurs, annonces... dans le domaine du Web sémantique et ses dérivés classée des sujets les moins techniques aux plus techniques qui vous amèneront immanquablement à mettre à disposition vos données selon les principes du Linked Data.

Lire la suite...

Web sémantique Geekeries —  1 commentaire

Photos, livres, musiques, what else ?

N'en déplaise à certains. Le manque de courage et les problèmes de structuration de ma pensée ne sont pas les seuls responsables de la diminution drastique des publications de ce blog. J'ai aussi mis à profit ces derniers mois pour développer plusieurs prototypes visant à démontrer les possibilités offertes par les technologies du Web sémantique et les données mises à disposition selon les principes du Linked Data. Je vous avais déjà présenté « la boîte à souvenirs », Manue s'était chargée, comme il se doit, du « Linked Book Mashup », permettez-moi de vous dévoiler aujourd'hui « Linked My Music ».

Lire la suite...

Structuration Sparql Wikipedia Geekeries Linked Data —  3 commentaires

Quoi de neuf en plus de 140 caractères ?

Il faut affronter les démons et revenir aux choses simples, une vieille habitude sacrifiée sur l'autel des 140 caractères twitteriens, grands vainqueurs de l'immédiateté et de la synthèse sans analyse, la pelote de liens.

Lire la suite...

RDF Sparql Causeries Linked Data —  2 commentaires

Comment faire...

...pour écrire ?

Perdu dans les méandres de mes pensées, noyé dans les tréfonds de mes idées, je n'arrive plus à aligner les mots... Trop de choses ou pas assez, mon cerveau ne sait plus ranger, classer et restituer. Peut-être me faut-il les vider en vrac pour y voir plus clair, les jeter sur l'écran pour mieux les maîtriser ?
Pérennisation, Linked data, données publiques ou gouvernementales, Web sémantique, Sparql, RDF, XML, métadonnées, METS, RDF, Triple store, moteur de recherche, alignement, SKOS, autant de sujets qui m'occupent toute la journée et encombrent ma tête sans pouvoir les ordonner. Je cherche désespérement la clé sans la trouver. Dois-je abandonner l'idée d'écrire ou persévérer tout en laissant en friche les textes inachevés ?

Lire la suite...

Causeries Perso —  6 commentaires