Les petites cases

Open Graph Protocol : Facebook se met au Web sémantique ?

Retour le 21 avril au soir : Facebook organise l'événement F8 au cours duquel il va annoncer les évolutions de sa plate-forme à destination des développeurs. A titre personnel, je n'ai pas vu l'annonce dont je n'ai a priori rien à attendre. Un premier twitt de Nicolas attire mon œil :

« Mark Zuckerberg - 3 fois le mot semantic par phrase.. des graphs dans tous les sens avec des connections avec d'autres sites. hmm.. »

Attiré, certes, mais sans grand espoir, je continue à vaquer à mes occupations numériques. Quelques minutes plus tard, première annonce concrète, Facebook met à disposition une « Graph API ». Alors que Régis a l'air enthousiaste, je partage la déception de Nicolas :

« Facebook propose une "Graph API" mais le format = JSON, les bras m'en tombent... http://graph.facebook.com/ via @rgaidot et @cyno »

Ce dernier essaye de me faire voir le bon côté des choses. Il a raison car les annonces ne sont pas terminées et quelques minutes plus tard, Manu Sporny relance nos espoirs en attirant l'attention sur un header de page HTML avec un encodage RDFa montré lors de la conférence :

« I think Facebook just announced RDFa support (the Open Graph Protocol) at F8: http://ow.ly/1Bm2g #rdfa #html5 #f8 (look at the attributes) »

Les soupçons sont rapidement confirmés, Facebook annonce Open Graph Protocol, un vocabulaire RDF très simple pour encoder en RDFa le titre de la page, le type de ressource décrite (vidéo, sport, entreprise, hôtel...), le titre du conteneur de la page et l'URL d'une image (et quelques autres choses..). Dans la foulée, Facebook annonce le support de ce protocole par plusieurs sites importants : IMDB, Microsoft, NHL, Posterous, Rotten Tomatoes...

Lire la suite...

Web Causeries Indexation RDFa Linked Data — 

RDFa 1.1 pour corriger les erreurs de jeunesse ?

RDFa est devenu, depuis plus d'un an, un des enjeux des batailles qui se nouent autour de HTML 5. Au cœur de la polémique, c'est ni plus ni moins que l'intégration de RDFa dans HTML 5 qui est en jeu, face au Microdata, principe concurrent proposé par Ian Hickson, un des éditeurs de HTML 5. Je ne vais pas revenir sur les débats qui agitent les spécialistes de la question, d'autant que si certains arguments sont recevables, il en est d'autres qui relèvent plus du combat d'ego. Face aux polémiques qui n'en finissaient plus d'enfler, aux retours des implémenteurs et à l'enjeu que revêtait RDFa suite aux différentes annonces effectués par Yahoo (SearchMonkey) et Google (Rich Snippets) pour ne citer qu'eux, le W3C a décidé de relancer le groupe de travail RDFa au mois de janvier 2010.

Lire la suite...

Structuration RDFa XHTML Geekeries —  1 commentaire

Vous avez dit « format pérenne » ?

Avant de poursuivre, j'aimerais revenir sur la question du format, en particulier tordre le cou à l'idée de « format pérenne ». Cela ne veut strictement rien dire. Aucun format n'est pérenne, car il est impossible d'imaginer toutes les évolutions possibles. Il est vrai, en revanche, que certains formats de par leurs caractéristiques sont plus simples à gérer sur le long terme que d'autres.

Lire la suite...

Management de l'information Râleries —  2 commentaires

Quelques considérations sur la notion de collection

Dans mon précédent billet, discutant l'expression « digital preservation », j'ai essayé de poser les bases de la gestion de l'information numérique pour en garantir la communication sur le long terme. J'ai ainsi cherché à démontrer que les tâches à effectuer pour l'information numérique ne différaient finalement pas de celles effectuées pour l'information sur le support traditionnel.

Dans ce billet, je voudrais faire quelques remarques sur la notion de collection (Amis, archivistes, j'espère que vous ne m'en voudrez pas d'avoir choisi cette terminologie, vous connaissez mon atavisme pour les bibliothèques ;-) ).

Lire la suite...

Management de l'information Système d'information Causeries —  2 commentaires

L'expression « digital preservation » est-elle pertinente ?

Deux ans que je travaille sur un projet pour mettre en place un « système de préservation » et, finalement, j'en viens à me poser cette question toute simple : l'expression « digital preservation » (traduite par le néologisme « préservation numérique ») est-elle pertinente ?
Rien n'est moins sûr quand je dresse le bilan du travail accompli, je dirais même que cette expression est l'arbre qui cache la forêt. Au final, j'ai l'impression qu'elle a fait croire que le problème se résoudrait par des moyens ou des compétences techniques, alors qu'il n'en est rien, les actions des futurs conservateurs/gestionnaires de collection numérique seront bien les mêmes que leurs collègues qui s'occupent des collections traditionnelles, ce sont les outils et les connaissances qui diffèrent et non les compétences.

Lire la suite...

Management de l'information Système d'information Causeries —  8 commentaires

La gazette du Web de données (1er trimestre 2010)

Un petit trimestre est passé depuis mon billet-pelote en forme de thérapie d'écriture. A part sur ce blog, il s'est passé plein de choses et comme plusieurs d'entre vous m'ont fait part de leur intérêt pour ce type de billets, je vous propose une sélection toute personnelle des derniers potins, nouveautés, rumeurs, annonces... dans le domaine du Web sémantique et ses dérivés classée des sujets les moins techniques aux plus techniques qui vous amèneront immanquablement à mettre à disposition vos données selon les principes du Linked Data.

Lire la suite...

Web sémantique Geekeries —  1 commentaire

Photos, livres, musiques, what else ?

N'en déplaise à certains. Le manque de courage et les problèmes de structuration de ma pensée ne sont pas les seuls responsables de la diminution drastique des publications de ce blog. J'ai aussi mis à profit ces derniers mois pour développer plusieurs prototypes visant à démontrer les possibilités offertes par les technologies du Web sémantique et les données mises à disposition selon les principes du Linked Data. Je vous avais déjà présenté « la boîte à souvenirs », Manue s'était chargée, comme il se doit, du « Linked Book Mashup », permettez-moi de vous dévoiler aujourd'hui « Linked My Music ».

Lire la suite...

Structuration Sparql Wikipedia Geekeries Linked Data —  3 commentaires

Quoi de neuf en plus de 140 caractères ?

Il faut affronter les démons et revenir aux choses simples, une vieille habitude sacrifiée sur l'autel des 140 caractères twitteriens, grands vainqueurs de l'immédiateté et de la synthèse sans analyse, la pelote de liens.

Lire la suite...

RDF Sparql Causeries Linked Data —  2 commentaires

Comment faire...

...pour écrire ?

Perdu dans les méandres de mes pensées, noyé dans les tréfonds de mes idées, je n'arrive plus à aligner les mots... Trop de choses ou pas assez, mon cerveau ne sait plus ranger, classer et restituer. Peut-être me faut-il les vider en vrac pour y voir plus clair, les jeter sur l'écran pour mieux les maîtriser ?
Pérennisation, Linked data, données publiques ou gouvernementales, Web sémantique, Sparql, RDF, XML, métadonnées, METS, RDF, Triple store, moteur de recherche, alignement, SKOS, autant de sujets qui m'occupent toute la journée et encombrent ma tête sans pouvoir les ordonner. Je cherche désespérement la clé sans la trouver. Dois-je abandonner l'idée d'écrire ou persévérer tout en laissant en friche les textes inachevés ?

Lire la suite...

Causeries Perso —  6 commentaires

La pérennisation de l'information numérique, mature ! Vraiment ?

Alors que l'avion nous ramenant en France survole les Etats-Unis et l'Océan atlantique, il est temps de prendre du recul pour tirer les leçons de notre séjour californien à l'occasion de la grande messe annuelle de la pérennisation de l'information numérique, IPRES, qui avait lieu cette année à San Fransisco. La conférence s'intitulait « Moving into the mainstream. Enabling our digital future » et était donc principalement axée sur des problématiques liées à l'organisation, l'économie et les moyens de garantir l'activité même de la pérennisation de l'information numérique. Cet intitulé impliquait l'idée que nous entrions dans une ère de maturité et de production après quelques années de recherche et de développement sur le sujet.

A l'issue de la conférence et des discussions avec les uns et les autres (le plus intéressant dans une conférence !), j'ai un sentiment mitigé. Bien sûr, le chemin parcouru est déjà très important au regard des enjeux et du défaitisme qui avait cours, il y a quelques années. Pourtant, deux tendances me semblent avoir fait leur apparition et viennent limiter ce sentiment de maturité :

  • le champ des possibles dans le domaine reste terriblement vaste, à la fois en termes de types de ressources numériques à couvrir et de moyens à tous les niveaux pour assurer une pérennisation efficiente 
  • une fracture est en train de se créer entre différentes conceptions de ce que peut/doit constituer l'activité de pérennisation de l'information numérique.

Lire la suite...

Système d'information Causeries Conservation —  3 commentaires