Les petites cases

Quelques considérations sur la notion de collection

Dans mon précédent billet, discutant l'expression « digital preservation », j'ai essayé de poser les bases de la gestion de l'information numérique pour en garantir la communication sur le long terme. J'ai ainsi cherché à démontrer que les tâches à effectuer pour l'information numérique ne différaient finalement pas de celles effectuées pour l'information sur le support traditionnel.

Dans ce billet, je voudrais faire quelques remarques sur la notion de collection (Amis, archivistes, j'espère que vous ne m'en voudrez pas d'avoir choisi cette terminologie, vous connaissez mon atavisme pour les bibliothèques ;-) ).

Lire la suite...

Management de l'information Système d'information Causeries —  2 commentaires

L'expression « digital preservation » est-elle pertinente ?

Deux ans que je travaille sur un projet pour mettre en place un « système de préservation » et, finalement, j'en viens à me poser cette question toute simple : l'expression « digital preservation » (traduite par le néologisme « préservation numérique ») est-elle pertinente ?
Rien n'est moins sûr quand je dresse le bilan du travail accompli, je dirais même que cette expression est l'arbre qui cache la forêt. Au final, j'ai l'impression qu'elle a fait croire que le problème se résoudrait par des moyens ou des compétences techniques, alors qu'il n'en est rien, les actions des futurs conservateurs/gestionnaires de collection numérique seront bien les mêmes que leurs collègues qui s'occupent des collections traditionnelles, ce sont les outils et les connaissances qui diffèrent et non les compétences.

Lire la suite...

Management de l'information Système d'information Causeries —  8 commentaires

La gazette du Web de données (1er trimestre 2010)

Un petit trimestre est passé depuis mon billet-pelote en forme de thérapie d'écriture. A part sur ce blog, il s'est passé plein de choses et comme plusieurs d'entre vous m'ont fait part de leur intérêt pour ce type de billets, je vous propose une sélection toute personnelle des derniers potins, nouveautés, rumeurs, annonces... dans le domaine du Web sémantique et ses dérivés classée des sujets les moins techniques aux plus techniques qui vous amèneront immanquablement à mettre à disposition vos données selon les principes du Linked Data.

Lire la suite...

Web sémantique Geekeries —  1 commentaire

Photos, livres, musiques, what else ?

N'en déplaise à certains. Le manque de courage et les problèmes de structuration de ma pensée ne sont pas les seuls responsables de la diminution drastique des publications de ce blog. J'ai aussi mis à profit ces derniers mois pour développer plusieurs prototypes visant à démontrer les possibilités offertes par les technologies du Web sémantique et les données mises à disposition selon les principes du Linked Data. Je vous avais déjà présenté « la boîte à souvenirs », Manue s'était chargée, comme il se doit, du « Linked Book Mashup », permettez-moi de vous dévoiler aujourd'hui « Linked My Music ».

Lire la suite...

Structuration Sparql Wikipedia Geekeries Linked Data —  3 commentaires

Quoi de neuf en plus de 140 caractères ?

Il faut affronter les démons et revenir aux choses simples, une vieille habitude sacrifiée sur l'autel des 140 caractères twitteriens, grands vainqueurs de l'immédiateté et de la synthèse sans analyse, la pelote de liens.

Lire la suite...

RDF Sparql Causeries Linked Data —  2 commentaires

Comment faire...

...pour écrire ?

Perdu dans les méandres de mes pensées, noyé dans les tréfonds de mes idées, je n'arrive plus à aligner les mots... Trop de choses ou pas assez, mon cerveau ne sait plus ranger, classer et restituer. Peut-être me faut-il les vider en vrac pour y voir plus clair, les jeter sur l'écran pour mieux les maîtriser ?
Pérennisation, Linked data, données publiques ou gouvernementales, Web sémantique, Sparql, RDF, XML, métadonnées, METS, RDF, Triple store, moteur de recherche, alignement, SKOS, autant de sujets qui m'occupent toute la journée et encombrent ma tête sans pouvoir les ordonner. Je cherche désespérement la clé sans la trouver. Dois-je abandonner l'idée d'écrire ou persévérer tout en laissant en friche les textes inachevés ?

Lire la suite...

Causeries Perso —  6 commentaires

La pérennisation de l'information numérique, mature ! Vraiment ?

Alors que l'avion nous ramenant en France survole les Etats-Unis et l'Océan atlantique, il est temps de prendre du recul pour tirer les leçons de notre séjour californien à l'occasion de la grande messe annuelle de la pérennisation de l'information numérique, IPRES, qui avait lieu cette année à San Fransisco. La conférence s'intitulait « Moving into the mainstream. Enabling our digital future » et était donc principalement axée sur des problématiques liées à l'organisation, l'économie et les moyens de garantir l'activité même de la pérennisation de l'information numérique. Cet intitulé impliquait l'idée que nous entrions dans une ère de maturité et de production après quelques années de recherche et de développement sur le sujet.

A l'issue de la conférence et des discussions avec les uns et les autres (le plus intéressant dans une conférence !), j'ai un sentiment mitigé. Bien sûr, le chemin parcouru est déjà très important au regard des enjeux et du défaitisme qui avait cours, il y a quelques années. Pourtant, deux tendances me semblent avoir fait leur apparition et viennent limiter ce sentiment de maturité :

  • le champ des possibles dans le domaine reste terriblement vaste, à la fois en termes de types de ressources numériques à couvrir et de moyens à tous les niveaux pour assurer une pérennisation efficiente 
  • une fracture est en train de se créer entre différentes conceptions de ce que peut/doit constituer l'activité de pérennisation de l'information numérique.

Lire la suite...

Système d'information Causeries Conservation —  3 commentaires

Contrer les idées reçues sur le Web sémantique

La médiatisation d'un nouveau concept, d'une nouvelle notion, d'une nouvelle technologie et de nouvelles perspectives s'accompagne immanquablement d'analyses plus ou moins farfelues, d'incompréhensions et d'interprétations erronnées (parfois volontairment pour profiter du buzz). Le Web sémantique n'échappe à cette tendance.

A l'instar de James Hendler qui a publié sa FAQ non officielle sur le Web sémantique, je vous propose de mon côté de revenir sur quelques idées reçues sur le Web sémantique.

Lire la suite...

Management de l'information Web sémantique Système d'information Causeries Moteur de recherche —  6 commentaires

Les technologies du Web sémantique au secours du Web 2.0

Si le Web 2.0 a permis le développement sur le Web d'une certaine forme d'intelligence collective avec des initiatives tels que Wikipedia, il a aussi, dans de nombreux cas, induit une captation des données par des sociétés commerciales.

En offrant des mécanismes standardisés de structuration, de mise à disposition, d'échanges et d'interrogation des données à l'échelle du Web, les technologies du Web sémantique permettent de mieux exploiter toutes les données créées et mises à disposition sur le Web et offrent aux utilisateurs un moyen de reprendre le contrôle de leurs données, en leur rendant leur capacité de choix.

Il y a quelques années, les utilisateurs du Web se le sont réappropriés au fur et à mesure grâce à une utilisation plus stricte des standards CSS et HTML, entre autres, causant en partie la remise en cause de la stratégie de Microsoft sur le Web (même si ce n'est pas encore complètement gagné). Gageons que l'appropriation et l'utilisation des standards du Web sémantique amèneront les Google, Facebook et consorts à remettre en question leur stratégie de main mise sur les données des utilisateurs.

Les technologies du Web sémantique et le Web de données (le Web 3.0 ??) seront-t-il les sauveurs des idéaux du Web 2.0 ? Personnellement, je ne me pose plus la question, j'en suis convaincu.

En guise d'arguments, je vous propose une petite application : « la boîte à souvenirs » dans laquelle j'ai utilisé les technologies du Web sémantique pour récupérer et valoriser mes données de Flick'r et les données mises à disposition par l'ensemble de la communauté de Wikipedia.

J'invite les personnes qui voudraient en savoir plus à consulter la description de l'application qui décrit précisément mes besoins et les moyens que j'ai mis en œuvre pour y répondre.

Lire la suite...

Geekeries

L'antilope sur le Web est-elle un document ?

Ce billet est une réponse au commentaire de Jean-Michel Salaün sous mon précédent billet. J'espère que Jean-Michel Salaün excusera la forme de ma réponse (c'était plus simple à gérer vu la longueur) et la distance que j'introduis par rapport à son commentaire (l'écriture d'un billet n'est pas le même exercice qu'un commentaire et il me semblait difficile de m'adresser directement à vous dans un billet :-) ).

Lire la suite...

Management de l'information Web sémantique Causeries Histoire —  4 commentaires