Si vous vous êtes un peu promené sur ce site ou si vous êtes arrivés par l'intermédiaire d'Homo numericus, il ne vous aura pas échappé que je m'intéresse aux langages à balises et plus particulièrement à la TEI (Text encoding Initiative). Au cours de mes différentes communications (et j'ai encore pu m'en apercevoir ce week-end à Bonn1) et de mes recherches, je me suis aperçu que cette initiative était reconnue et citée, mais malheureusement encore trop peu utilisée. En même temps, je vous comprends, vous préférez certainement lire un bon bouquin, plutôt que de vous enfiler les guidelines et comprendre les mécanismes de ce « monstre ». Pourtant, comme vous allez le voir, les guides et les explications ne manquent pas sur le Web. Mais, pour faire plaisir à ma chère et tendre qui m'a demandé si gentiment d'expliquer la TEI et parce que ça me faisait envie (je dois l'avouer), je vais ajouter ma pierre à l'édifice. Je précise tout de suite que cette modeste présentation en plusieurs billets ne remplacera jamais la lecture des guidelines, mais j'espère qu'elle vous donnera envie de vous plonger dedans et vous aidera à aborder en douceur ce monument des langages à balises qu'est la TEI.
Pour la définition de la TEI, je vous renvoie au billet que lui a consacré BlogOkat, car c'est une gageure de définir TEI et jamais je ne parviendrai à ce niveau de synthèse2. Pour les pressés qui n'ont pas le temps de cliquer, voici la phrase importante à retenir (ce qui est entre crochet est un ajout de ma part) :
« la DTD TEI [mise au point par un consortium international], fondée à l'origine sur le SGML et s'appuyant désormais sur le XML, est un langage de marquage qui permet d'échanger des données textuelles, notamment pour les sciences humaines et les études sur les textes littéraires. »
Pour commencer en douceur et pour ceux qui seraient pressés de coder leur premier texte en TEI avant le cinquième billet, voici, en vrac et de façon non exhaustive, quelques ressources en français3 :
La DTD TEI, troisième billet de la saga des DTD, article déjà cité de blogOkat ;
Présentation de la TEI, par Laurent Romary et Henri Hudrisier sur le site du Réseau international francophone d'aménagement linguistique
Introduction à la TEI dans la revue électronique Texto
XML+TEI, un mariage fait aux cieux, diaporama de présentation en français de la TEI par Lou Burnard, MSH, université de Lyon, novembre 2001
Traduction en français de la TEILite sur le site du TEI consortium et la version d'origine sur le site des cahiers de Gutemberg. La traduction a été effectuée par François Rôle, ancien élève de l'Ecole des chartes (qui a dit que je voulais augmenter le pagerank du site de l'Ecole des chartes ? ;-) )
Les cahiers de Gutemberg numéro 24 de Juin 1996 avec une présentation de la TEI par le grand professeur Aixtal.
Expériences d'encodage TEI par Jean-Luc Benoît, introduction simple à la TEI sous forme de diaporama.
« Faire un corpus TEI pas à pas » dans la revue Texto
La Text Encoding Initiative : les moyens pour ajouter de la valeur à un texte numérisé par Guylaine Baudry dans la revue Cursus
Plusieurs articles autour d'un projet de balisage des lettres de rémission de la chancellerie de Bretagne au format TEI par Nicole Dufournaud et Jean-Daniel Fekete4 ;
Expérience de codage de document à intérêt graphique à l'aide de TEI, par Jean-Daniel Fekete
Capitalisation des savoirs par le Web : une application de la TEI pour l'encodage et l'exploitation des textes de la Base de Français médiéval par Serge Heiden et Céline Guillot
Le guide du balisage de la base de français médiéval de l'ENS-LSH.
Le guide du balisage du Cartulaire blanc de l'abbaye de Saint-Denis (quoi ? je recommence... Mais non, j'y suis pour rien)
Pour les ressources en anglais, vous pouvez consulter le site du TEI consortium, en particulier la partie Talks et Tutorials. Je vous conseille en particulier les trois diaporamas, parfaits pour débuter, qui composent la présentation de Lou Burnard et Matthew Drisscol : Annotation of written cultural heritage.
Pour finir avec ce premier billet sur la TEI, je signale que Nancy (ATILF, INIST et LORIA) est devenu centre européen de support au consortium TEI depuis le 1er janvier 2005. A cette occasion, une liste de discussion francophone sur la TEI a été mise en place et des rencontres TEI sont organisées les 20 et 21 octobre prochain à Nancy.
Quelques notes en passant
1 Dès que j'ai un peu de temps, je mettrai en ligne cette communication donnée à l'occasion du congrès de la commission internationale de diplomatique.
2 Au passage, un grand remerciement à BlogOkat de la part de mes stagiaires qui ont pu définir parfaitement TEI dans leurs rapports de stage grâce à toi ;-)
3 Si vous avez d'autres ressources en français sur la TEI et qui ne serait pas sur cette liste, n'hésitez pas à m'envoyer un petit message.
4 Jean-Daniel Fekete a été mon « gourou » TEI, qu'il soit ici remercié, ainsi que Sylvie sans qui je n'aurai jamais regardé en détail la TEI
Commentaires