Les petites cases

Conservation

Bilan de 15 ans de réflexion sur la gestion des données numériques

Cela fait maintenant deux ans que j’ai rejoint l’Institut national de l’audiovisuel. Deux années qui m’ont permis de donner une nouvelle impulsion à ma réflexion sur la gestion des données numériques. Deux années passionnantes et qui se concrétisent depuis plus de six mois par le développement d’une infrastructure de traitement et de stockage des données, aboutissement (forcément provisoire) d’une vision de l’architecture du système d’information où la donnée occupe une place centrale, à l’inverse de l’approche traditionnelle par le processus. Deux années dont les résultats font en partie l’objet d’un article pour le prochain livre d’Emmanuelle sur l’avenir des catalogues, à paraître aux éditions du Cercle de la librairie et dont l’écriture m’a donné envie de faire revivre un peu cet espace de partage que j’ai laissé en friche ces dernières années.

Mais avant de partager ces nouveaux éléments, il me semble intéressant de dresser un bilan de ces 15 dernières années afin de tracer la ligne directrice et de brosser aussi les réussites, les échecs et les erreurs. La lecture de quelques (excellents) mémoires du master « Technologies numériques appliquées à l’histoire » de l’Ecole nationale des chartes m’ont aussi motivé à préciser (ou repréciser) certaines approximations que j’ai pu rencontrer ici ou là.

Alors, voilà, avant de passer à la suite, un bilan de 15 ans de réflexion sur la gestion des données numériques, forcément subjectif et en aucun cas exhaustif. Il se découpe en quatre phases, qui correspondent à des moments de mon parcours professionnel et, ça va de pair, avec les sujets principaux qui ont été au cœur de ma réflexion. Elles sont les suivantes :

  • l’édition électronique ;
  • la conservation sur le long terme de l’information numérique ;
  • le traitement des données structurées et semi-structurées ;
  • l’architecture de données à l’ère du Big data.

Lire la suite...

Management de l'information Structuration RDF Web sémantique XML Système d'information Sparql Web Causeries Conservation Digital humanities Édition critique Édition électronique Histoire Moteur de recherche SHS TEI Perso

Information numérique : défintions et enjeux

Alors que j'étais en train de préparer une nouvelle formation, je suis retombé sur différents diaporamas que j'avais constitués à l'époque où je travaillais sur la pérennisation de l'information numérique. Comme je n'en aurai plus vraiment l'utilité, je me suis dit qu'il pourrait être intéressant de les partager, plutôt que les laisser dans un recoin de mon disque dur. Last but not least, cela me permettait d'alimenter ce blog, largement en déshérence ces derniers temps...

Ce diaporama est le résultat de la fusion d'une formation que j'avais mise au point pour présenter les enjeux de la pérennisation de l'information numérique à mes collègues d'Atos Origin, lorsque je travaillais sur le projet SPAR de la BnF et d'une présentation de ces problématiques à destination de décideurs. Vous reconnaîtrez peut-être certaines diapos de Manue, en particulier la fameuse disquette.

Placé sous licence CC-BY, ce diaporama est à votre disposition. N'hésitez pas, c'est fait pour ça.

Lire la suite...

Structuration XML Système d'information Web Causeries Conservation Numérisation —  1 commentaire

Une communauté des digital humanities est née

Cette semaine avait lieu le ThatCamp à Paris. Derrière ce nom un peu mystérieux (en réalité, acronyme de « The Humanities and Technology Camp) se cache une non-conférence sur le modèle du barcamp dédiée aux Digital Humanities, « transdiscipline, porteuse des méthodes, des dispositifs et des perspectives heuristiques liés au numérique dans le domaine des Sciences humaines et sociales » (définition issue du Manifeste, cf. plus loin) et auxquelles j'ai fait allusion à plusieurs reprises sur ce blog.

Elle constituait une occasion de revoir plein d'amis, anciens collègues, anciens camarades de jeux et connaissances numériques/virtuels dans un cadre de discussions ouvert sur des sujets variés. Et, je ne fus pas déçu, car ce rassemblement a marqué le véritable acte de « naissance » d'une communauté des digital humanities en France. Naissance actée par un Manifeste rédigé tout au long des deux jours d'ateliers et discuté par tous lors de la session finale. Ce manifeste assoit et légitime l'existence de cette communauté et affirme l'importance des digital humanities dans l'Enseignement supérieur et la Recherche, de manière plus large comme une opportunité professionnelle dans tous les secteurs (et j'en sais quelque chose) et son rôle dans l'apprentissage du savoir au XXIe siècle.

Vous êtes d'ailleurs cordialement invités à signer ce manifeste, si vous vous reconnaissez dans cette communauté et dans les objectifs qu'elle s'est fixés.

Lire la suite...

Système d'information Causeries Conservation Digital humanities — 

La pérennisation de l'information numérique, mature ! Vraiment ?

Alors que l'avion nous ramenant en France survole les Etats-Unis et l'Océan atlantique, il est temps de prendre du recul pour tirer les leçons de notre séjour californien à l'occasion de la grande messe annuelle de la pérennisation de l'information numérique, IPRES, qui avait lieu cette année à San Fransisco. La conférence s'intitulait « Moving into the mainstream. Enabling our digital future » et était donc principalement axée sur des problématiques liées à l'organisation, l'économie et les moyens de garantir l'activité même de la pérennisation de l'information numérique. Cet intitulé impliquait l'idée que nous entrions dans une ère de maturité et de production après quelques années de recherche et de développement sur le sujet.

A l'issue de la conférence et des discussions avec les uns et les autres (le plus intéressant dans une conférence !), j'ai un sentiment mitigé. Bien sûr, le chemin parcouru est déjà très important au regard des enjeux et du défaitisme qui avait cours, il y a quelques années. Pourtant, deux tendances me semblent avoir fait leur apparition et viennent limiter ce sentiment de maturité :

  • le champ des possibles dans le domaine reste terriblement vaste, à la fois en termes de types de ressources numériques à couvrir et de moyens à tous les niveaux pour assurer une pérennisation efficiente 
  • une fracture est en train de se créer entre différentes conceptions de ce que peut/doit constituer l'activité de pérennisation de l'information numérique.

Lire la suite...

Système d'information Causeries Conservation —  3 commentaires

Un peu de lecture

En attendant que je réussisse à émerger, ce qui ne devrait pas tarder (un billet est en train de mûrir, je vous le promets), je propose à ceux que ma prose manquerait un peu de lecture.

Lire la suite...

Structuration Web sémantique Causeries Conservation Digital humanities Édition électronique Indexation TEI Wiki — 

Telma sans Louise

Les dernières semaines furent silencieuses sur ce blog, mais très studieuses dans la vraie vie.

Lire la suite...

XML Causeries Conservation Digital humanities Édition critique Édition électronique Histoire Indexation Outils —  3 commentaires

Conservation du document numérique et édition éléctronique

Non, ce blog ne se repose pas comme certain de ma connaissance, je ne trouve juste pas le temps de bloguer (ni l'énergie, j'avoue), préparant une communication pour le colloque Digital Humanities qui aura lieu à Paris du 5 au 9 juillet. Pourtant, ce n'est pas faute d'avoir des sujets entre la suite de mon dossier sur l'édition à l'ère du numérique et la fin de mes aventures au pays de la conservation du document numérique.

Pour vous faire passer le temps en attendant ce jour béni où je pourrai à nouveau reprendre ce blog, je vous propose la lecture d'une communication (et le diaporama) que j'ai faite à la dernière réunion du groupe PIN (Préservation pour l'information numérique). Il y est évidemment question de la problématique de la conservation du document numérique et de l'utilisation du modèle OAIS dans le contexte de l'édition électronique. J'y présente l'état de la réflexion et d'avancement des outils mis en place dans le cadre du centre de ressources numériques TELMA porté par l'IRHT et l'École des chartes.

Bonne lecture !!

Lire la suite...

XML Causeries Conservation Édition électronique — 

Les éditeurs et les métadonnées : ONIX

Avant de passer à l'étape finale de constitution de mon METS et donc de mon SIP, je me suis dit qu'il ne serait pas inutile de s'intéresser à ONIX. Il s'agit d'une grammaire XML mise au point par EdiTEUR, un groupe international d'éditeurs dont la vocation est de coordonner les initiatives et les standards pour le commerce électronique dans le domaine du livre.

Lire la suite...

Structuration XML Conservation Édition électronique Geekeries — 

PREMIS ou les prémices de la conservation numérique

PREMIS est l'acronyme de Preservation metadata : implementation strategies. Ce format, mis au point par un groupe de travail soutenu par OCLC et RLG, est destiné à proposer un « framework » des éléments principaux (« core ») pour la conservation du document numérique.

Lire la suite...

Structuration XML Conservation Édition électronique Geekeries —  1 commentaire

METS et tu mets tes fichiers dans des petites cases

Comme promis dans mes précédents billets, je vais partager avec vous mon utilisation des formats METS et PREMIS pour constituer les SIP (Submission information package, n'en déplaise aux esprits mal placés...), les paquets de versements dans notre entrepôt numérique de données suivant le modèle OAIS.

Lire la suite...

Structuration XML Conservation Geekeries —  10 commentaires