Les petites cases

Édition critique

Bilan de 15 ans de réflexion sur la gestion des données numériques

Cela fait maintenant deux ans que j’ai rejoint l’Institut national de l’audiovisuel. Deux années qui m’ont permis de donner une nouvelle impulsion à ma réflexion sur la gestion des données numériques. Deux années passionnantes et qui se concrétisent depuis plus de six mois par le développement d’une infrastructure de traitement et de stockage des données, aboutissement (forcément provisoire) d’une vision de l’architecture du système d’information où la donnée occupe une place centrale, à l’inverse de l’approche traditionnelle par le processus. Deux années dont les résultats font en partie l’objet d’un article pour le prochain livre d’Emmanuelle sur l’avenir des catalogues, à paraître aux éditions du Cercle de la librairie et dont l’écriture m’a donné envie de faire revivre un peu cet espace de partage que j’ai laissé en friche ces dernières années.

Mais avant de partager ces nouveaux éléments, il me semble intéressant de dresser un bilan de ces 15 dernières années afin de tracer la ligne directrice et de brosser aussi les réussites, les échecs et les erreurs. La lecture de quelques (excellents) mémoires du master « Technologies numériques appliquées à l’histoire » de l’Ecole nationale des chartes m’ont aussi motivé à préciser (ou repréciser) certaines approximations que j’ai pu rencontrer ici ou là.

Alors, voilà, avant de passer à la suite, un bilan de 15 ans de réflexion sur la gestion des données numériques, forcément subjectif et en aucun cas exhaustif. Il se découpe en quatre phases, qui correspondent à des moments de mon parcours professionnel et, ça va de pair, avec les sujets principaux qui ont été au cœur de ma réflexion. Elles sont les suivantes :

  • l’édition électronique ;
  • la conservation sur le long terme de l’information numérique ;
  • le traitement des données structurées et semi-structurées ;
  • l’architecture de données à l’ère du Big data.

Lire la suite...

Management de l'information Structuration RDF Web sémantique XML Système d'information Sparql Web Causeries Conservation Digital humanities Édition critique Édition électronique Histoire Moteur de recherche SHS TEI Perso

Telma sans Louise

Les dernières semaines furent silencieuses sur ce blog, mais très studieuses dans la vraie vie.

Lire la suite...

XML Causeries Conservation Digital humanities Édition critique Édition électronique Histoire Indexation Outils —  3 commentaires

Les réalités dans l'encodage XML

Depuis que nous nous sommes revus1 à Digital Humanities en juillet, Christian Vandendorpe2 et moi débattons du problème de l'encodage en XML des caractéristiques physiques d'un document.

Lire la suite...

Structuration XML Causeries Édition critique TEI —  1 commentaire

Qu΄est-ce-qu΄on encode ?

Lorsqu'on encode un fichier en XML, bien souvent, on ne prend pas le temps, avant de se lancer à proprement parler dans le codage, de réfléchir à une question simple, mais pourtant essentielle : qu'est-ce-qu'on veut encoder ? Cette question a l'air anodine, mais la réponse peut faire varier de façon très importante la structure du fichier et le choix des balises. Je voudrais essayer de montrer avec ce billet l'impact de cette question dans les stratégies d'encodage.

Lire la suite...

Structuration Causeries Édition critique TEI XHTML —  2 commentaires

Nouvelle version de la TEI

Non, il ne s'agit pas de la version finale de la P5, mais la sortie d'une version intermédiaire (0.4.1) que vient d'annoncer Sebastian Rathz. Alors, pourquoi en faire un billet ? Tout simplement, pour prévenir toutes les personnes qui travaillent autour de moi avec la P5 que les changements sont suffisamment importants pour regénérer leurs schémas et mettre à la poubelle les anciens, donc direction Roma...

Parmi les changements, outre la révision du système de classes, je signalerais deux changements.

Le premier me fait d'autant plus plaisir que j'en fais la demande depuis un an auprès du TEI Board. En P5, deux nouveaux attributs ont été ajoutés pour les dates notBefore et notAfter, ils permettent de proposer une fourchette dans le cas de dates approximatives, ce qui est bien connu de nous autres médiévistes. Malheureusement, ils n'étaient pas implémentés sur tous les élements de type date (en particulier <docDate>), c'est maintenant chose faite, ce qui marque le glas des éléments dateStruct and timeStruct (Petit message perso : désolé, Christophe, il faut que tu reprennes toutes tes dates, mais en même temps, tu ne peux pas dire que je ne t'avais pas

Lire la suite...

Édition critique TEI Geekeries —  1 commentaire

Je vais pouvoir m'y remettre !!

J'ai enfin terminé d'écrire les différents articles, je n'ai plus de déplacements et donc de communications pour l'instant et les cours et les séminaires sont derrière moi ! Bref, je suis enfin libre pour recommencer à bloguer et ça tombe bien, j'ai plein d'idées en tête. Mais, pour l'instant, j'ai juste envie de me reposer, de prendre le temps, de flâner, de réfléchir tranquillement, avant de vous en faire partager les fruits.

En attendant, vous pouvez utiliser ce temps libre pour jeter un coup d'œil sur les nouveaux ouvrages dans la collection ELEC de l'Ecole nationale des chartes. Ils ont tous les deux une place particulière à mes yeux. Le premier, les chroniques latines de Saint-Denis, est la première édition d'un manuscrit littéraire du Moyen Âge, il va à l'encontre des règles habituelles d'édition de la philologie latine en éditant un manuscrit précis et pour finir c'est la première édition je n'ai pas faite et absolument pas touchée. Nicolas Legrand, Aka Nico (si vous ne connaissez pas Nico, allez faire un tour dans les commentaire du Figoblog ;-) ), a fait un fantastique boulot et je lui renouvelle ici toutes mes félicitations. Évidemment, il

Lire la suite...

Causeries Édition critique Édition électronique Numérisation TEI — 

La philologie numérique existe-t-elle ?

J'ai eu la chance de participer la semaine dernière à un « séminaire international » sur l'édition critique numérique intitulé « Digital philology and medieval texts » qui avait lieu à Arezzo en Toscane. Si ce genre de rencontres ne sert malheureusement pas souvent à grand chose, il n'en était rien pour celle-ci.

Lire la suite...

Causeries Digital humanities Édition critique Édition électronique Histoire TEI —