Les petites cases

A la découverte de la TEI

Si vous vous êtes un peu promené sur ce site ou si vous êtes arrivés par l'intermédiaire d'Homo numericus, il ne vous aura pas échappé que je m'intéresse aux langages à balises et plus particulièrement à la TEI (Text encoding Initiative). Au cours de mes différentes communications (et j'ai encore pu m'en apercevoir ce week-end à Bonn1) et de mes recherches, je me suis aperçu que cette initiative était reconnue et citée, mais malheureusement encore trop peu utilisée. En même temps, je vous comprends, vous préférez certainement lire un bon bouquin, plutôt que de vous enfiler les guidelines et comprendre les mécanismes de ce « monstre ». Pourtant, comme vous allez le voir, les guides et les explications ne manquent pas sur le Web. Mais, pour faire plaisir à ma chère et tendre qui m'a demandé si gentiment d'expliquer la TEI et parce que ça me faisait envie (je dois l'avouer), je vais ajouter ma pierre à l'édifice. Je précise tout de suite que cette modeste présentation en plusieurs billets ne remplacera jamais la lecture des guidelines, mais j'espère qu'elle vous donnera envie de vous plonger dedans et vous aidera à aborder en douceur ce monument des langages à balises qu'est la TEI.

Pour la définition de la TEI, je vous renvoie au billet que lui a consacré BlogOkat, car c'est une gageure de définir TEI et jamais je ne parviendrai à ce niveau de synthèse2. Pour les pressés qui n'ont pas le temps de cliquer, voici la phrase importante à retenir (ce qui est entre crochet est un ajout de ma part) :

« la DTD TEI [mise au point par un consortium international], fondée à l'origine sur le SGML et s'appuyant désormais sur le XML, est un langage de marquage qui permet d'échanger des données textuelles, notamment pour les sciences humaines et les études sur les textes littéraires. »

Pour commencer en douceur et pour ceux qui seraient pressés de coder leur premier texte en TEI avant le cinquième billet, voici, en vrac et de façon non exhaustive, quelques ressources en français3 :

Pour les ressources en anglais, vous pouvez consulter le site du TEI consortium, en particulier la partie Talks et Tutorials. Je vous conseille en particulier les trois diaporamas, parfaits pour débuter, qui composent la présentation de Lou Burnard et Matthew Drisscol : Annotation of written cultural heritage.

Pour finir avec ce premier billet sur la TEI, je signale que Nancy (ATILF, INIST et LORIA) est devenu centre européen de support au consortium TEI depuis le 1er janvier 2005. A cette occasion, une liste de discussion francophone sur la TEI a été mise en place et des rencontres TEI sont organisées les 20 et 21 octobre prochain à Nancy.

Quelques notes en passant

1 Dès que j'ai un peu de temps, je mettrai en ligne cette communication donnée à l'occasion du congrès de la commission internationale de diplomatique.

2 Au passage, un grand remerciement à BlogOkat de la part de mes stagiaires qui ont pu définir parfaitement TEI dans leurs rapports de stage grâce à toi ;-)

3 Si vous avez d'autres ressources en français sur la TEI et qui ne serait pas sur cette liste, n'hésitez pas à m'envoyer un petit message.

4 Jean-Daniel Fekete a été mon « gourou » TEI, qu'il soit ici remercié, ainsi que Sylvie sans qui je n'aurai jamais regardé en détail la TEI

TEI Geekeries — 

Commentaires

Merci Got pour ces explications d'une grande clarté sur la TEI ! Cela fait longtemps que je songeais à m'y mettre et j'ai franchi le pas tout récemment. Je suis en train de préparer la refonte de mon site perso sur la poésie baroque et j'ai bien envie d'utiliser la TEI pour structurer les poèmes et les autres textes littéraires. Ensuite, grâce à une feuille de style XSL très inspirée de la tienne ;-) je vais générer le HTML pour l'affichage. J'ai fait quelques petits tests en utilisant la TEI lite. C'est nickel !