Les petites cases

TEI et les références bibliographiques

J'ai récemment regardé de plus près les éléments offerts par la TEI pour coder les références bibliographiques, à l'occasion d'une rencontre avec une stagiaire-conservateur de l'ENSSIB, Anne-Claire Bernaudin (que je salue amicalement, puisque c'est une lectrice de ce blog), qui encode dans le cadre de son stage une bibliographie en EAD1et qui voulait faire un comparatif avec TEI et MODS. Pour continuer ma saga de la TEI comme dirait Blogokat, je vais donc vous faire partager le fruit de nos découvertes.

Il existe trois éléments pour décrire une référence bibliographique :

  1. <bibl> contient une référence « vaguement »2 structurée, c'est à dire que les différents éléments de la référence peuvent être balisés ou non, au choix de l'encodeur ;

  2. <biblStruct> contient une référence très structurée, dans laquelle seules les éléments TEI spécifiques à la description bibliographique sont acceptés ;

  3. <biblFull> contient une référence très structurée qui utilise les éléments autorisés dans l'élément <fileDesc> du header, c'est à dire l'ensemble des éléments qui permettent de décrire un fichier TEI, pour encoder la référence bibliographique. (Mise à jour, 15/11/2005 : grâce à l'attention d'Anne-Claire Bernaudin, je me suis aperçu que je m'étais trompé : ce ne sont pas tous les éléments du header qui sont autorisés, mais seulement ceux de <fileDesc>, merci à toi)

Un quatrième élément <listBibl> permet d'organiser une liste de référence bibliographique, chaque entité étant décrit par un des éléments précédents. Je ne reviendrais pas sur <biblFull>, car j'espère pouvoir faire un billet sur le TEI Header3.

Le guidelines définit quatre parties dans une référence bibliographique :

  1. Les éléments qui regroupent dans une référence bibliographique très structurée les composants des niveaux analytic, c'est à dire un article, un poème ou toute autre composante d'un ouvrage décrit spécifiquement (au hasard un acte diplomatique dans une édition de cartulaire ;-) ), monographic, c'est à dire la description de l'entité (livre ou numéro de revue) qui possède une indépendance physique4 et series, c'est à dire les informations sur la série dans laquelle prend place l'entité bibliographique décrit : une revue, une collection... ;

  1. le titre de la référence et les responsabilités intellectuelles ;

  2. les informations relatives à la publication de l'ouvrage (lieu, date, éditeur commercial...) et la pagination ;

  3. les annotations, commentaires et les autres détails.

Pour la première partie, les éléments <analytic>, <monographic> et <series> permettent d'encoder les différentes parties de la référence bibliographique structurée.

Pour le titre et les responsabilités intellectuelles, nous disposons des éléments suivants :

  1. <title> contient le titre de l'entité décrite. A signaler deux attributs spécifiques : level permettant d'indiquer si vous indiquez le titre d'un article, d'un livre, d'une revue, d'une collection ou de matériaux non-publiés et type qui permet d'indiquer selon votre propre convention s'il s'agit d'un titre, surtitre ou sous-titre ;

  2. <author> contient le nom de l'auteur, que ce soit une personne ou une institution, c'est à dire le responsable principale de l'écriture de l'entité ;

  3. <editor> contient le nom de l'éditeur, dans le sens de la personne qui intervient sur le contenu intellectuel du texte (un éditeur scientifique ou un directeur de publication, par exemple), à ne pas confondre avec <publisher> qui contient le nom de l'éditeur commercial. La langue anglaise possède deux mots pour désigner l'éditeur, là où le français n'en possède malheureusement qu'un ;

  4. <respStmt> permet de désigner tous les autres intervenants sur le texte en dehors de l'auteur et de l'éditeur, par exemple un traducteur ;

  5. <name> contient un nom propre ou nom commun permettant de séparer le prénon du nom de famille pour un auteur par exemple ;

  6. <meeting> permet d'indiquer des précisions d'un colloque, rencontre ou conférence dont peut-être issu l'entité bibliographique.

Pour les informations relatives à la publication de l'ouvrage :

  1. <address> contient l'adresse de l'éditeur commercial par exemple ou du diffuseur ;

  2. <pubPlace> le nom du lieu de publication de l'entité ;

  3. <publisher> le nom de l'organisme responsable de la publication ou de la distribution

  4. <date> contient la date de pulication ;

  5. <idno> fournit un numéro identifiant l'entité standardisé ou non, comme l'ISBN ou une cote par exemple, vous pouvez d'ailleurs en préciser le type dans l'attribut type ;

  6. <extent> permet d'indiquer le nombre de pages de l'entité

  7. <biblScope> est une élément générique définissant l'étendue la référence bibliographique, vous pouvez donc indiquer les numéros de pages dans le cadre d'un article, le numéro d'un volume dans le cas d'une revue ou d'une collection... L'attribut type permet de préciser le type d'étendue que vous indiquez.

Vous pouvez regrouper les informations concernant la publication et la diffusion dans un élément <imprint>.

Enfin, vous pouvez annoter cette référence avec l'élément <note> dans lequel vous pouvez indiquer la table des matières sous forme de list avec l'élément <list> ou encore faire référence à une autre entité bibliographique.

Un exemple complet :

<biblStruct>
	<!-- Description de l'article -->
	<analytic>
		<!--Auteur de l'article précisément en séparant prénom et nom de famille-->
		<author>
			<name type="prenom">Gautier</name>
			<name type="nomfamille">Poupeau</name>
		</author>
		<!--Titre de l'article avec précision du level a pour désigner l'article-->
		<title type="titre" level="a">L'édition électronique de sources historiques</title>
		<title type="sous-titre">De nouvelles approches de l'indexation ?</title>
	</analytic>
	<!-- Description du numéro de la revue -->
	<monogr>
		<!-- Description de la journée d'études dont est issu ce numéro de la revue -->
		<meeting>Journées d'études "Indexer le récit" organisées par Jacques Berlioz
			et Anne-Marie Polo de Beaulieu</meeting>
		<editor>Marie-Anne Polo de Beaulieu</editor>
		<title level="m">Indexer les <foreign lang="lat">exempla</foreign> médiévaux</title>
		<imprint>
			<pubPlace>Paris</pubPlace>
			<publisher>Centre de recherche historique de l'EHESS</publisher>
			<date>2005</date>
		</imprint>
		<!--Etendue de l'article dans la revue-->
		<biblScope type="page">71-78</biblScope>
		<!--Nombre de pages de la revue-->
		<extent>149</extent>
	</monogr>
	<!--Description de la revue-->
	<series>
		<title level="j">Cahiers du centre de recherches hitoriques</title>
		<biblScope type="numéro">35</biblScope>
		<respStmt>
			<resp>Directeur de publication</resp>
			<name>Bernard Vincent</name>
		</respStmt>
	</series>
	<!--Notes complémentaires sur l'entité bibliographique-->
	<note>
		<p>Présentation des avantages et des enjeux liés à l'édition électronique de
			sources historiques à partir de l'expérience de l'Ecole des chartes.
			Cette présentation permet d'aborder l'avenir de l'indexation dans le
			cadre de la publication sur le Web, en particulier dans la perspective
			du Web sémantique.</p>
		<p>La vidéo de cette communication est disponible en ligne sur le site des
			archives audiovisuelles de la recherche en sciences humaines et sociales
			et son texte a été publié sur les petites cases.</p>
	</note>
</biblStruct>

Un exemple simple :

<bibl>
	<author>Gautier Poupeau</author>, <title level="a">L'édition électronique de
	sources historiques. Nouvelles approches de l'indexation</title>, dans
	<title level="m">Indexer les <foreign>exempla</foreign> médiévaux</title>
	sous la direction de Marie-Anne Polo de Beaulieu, <title level="j">Cahier du
	centre de recherches historiques</title>, n° 35, avril 2005, <biblScope
	type="page">pp. 71-78</biblScope>
</bibl>

Quelques notes en passant

1 Bonne initiative de l'ENSSIB de faire encoder à la mano (eh ! oui !), car c'est certainement l'exercice le plus formateur pour apprendre XML et une grammaire particulière de balisage.

2 Comme Manue, j'ai aussi bloqué sur la traduction de loosely ;-)

3 Petit message perso pour Anne-Claire, finalement, c'est peut-être une solution du problème d'utiliser <biblFull> car tu pourras encoder tes sujets sans problème.

4 On va s'amuser pour décrire une partie d'un site Web ;-)

TEI Geekeries —