Les petites cases

TEI et les éléments d'un texte, la suite

Reprenons notre découverte de la TEI où nous nous en étions arrêtés, c'est à dire les informations présentes dans une portion d'information, c'est à dire à l'intérieur du <div>. Après avoir vu les différentes façons de coder l'italique qui représentait la partie la plus complexe, attaquons nous à toutes les autres informations.

Les notes

Une note est une information attachée à un endroit précis du texte. Elle permet :

  • de donner une référence bibliographique

  • d'introduire des compléments d'informations qui ne sont pas en relation directe avec le texte, c'est à dire de faire une digression

  • de faire un commentaire

Elle est composée de deux parties : l'appel de notes et le contenu de la note, généralement porté en bas de page ou à la fin du texte. L'appel de notes n'est pas une information à part entière, elle n'est qu'une partie de la note, il est donc normal que cet appel de notes ne soit pas balisé en tant que tel. Par conséquent, en TEI, on place le contenu de la note à l'emplacement de l'appel de notes avec l'élément <note>. L'appel de notes peut être indiqué grâce à l'attribut n et on peut aussi préciser l'emplacement de la note avec l'attribut place. Exemple

<div><p>votre texte<note n="1">Contenu de la note</note> votre texte</p></div>

Lorsque vous voulez afficher ce texte en HTML ou dans un format de texte (PDF, PS ou autre), vous restituez alors la note en bas de page.

Malgré tout, si cela vous perturbe trop, vous pouvez toujours coder l'appel de notes et placer la note à la fin de votre <div>. Lou Burnard nous a montré ce système lors des rencontres TEI, mais, ça doit être un acte manqué, je n'ai plus le document sur lequel j'avais noté cette méthode ;-).

Les listes

Le codage des listes en TEI ressemble à ce qui se fait en HTML, mais est plus complet. Une liste constitue un ensemble organisé d'items (phrases, mots, termes définis...). Il existe donc deux éléments primordiaux : <list> au début de la liste et <item> pour chaque item. Non seulement, c'est simple, mais en plus c'est plus parlant que <ul> et <li>, non ?

Vous pouvez auss indiquer un titre à votre liste avec l'élément <head> et une étiquette à chaque item avec l'élément <label>. <label> vous permet par exemple d'indiquer le terme défini dans le cas d'un glossaire, la définition sera indiquée avec <item> ou la numérotation de votre liste. Par exemple :

<list>
<head>Ma liste</head>
<label>1</label><item>Contenu de l'item</item>

<label>2</label><item>Contenu de l'item</item>

</list>

Les citations

Une citation permet d'indiquer deux choses :

  • L'intervention rapportée d'une personne dans un roman : « Le chien aboie » a dit Pierre

  • Une portion d'information insérée dans le texte qui n'est pas de la responsabilité de l'auteur.

Pour chacune de ces deux types de citations, il existe une balise spécifique. L'élément <q> est réservé au premier cas, c'est pourquoi il est complété par l'attribut who permettant d'indiquer la personne qui a prononcé ces mots, type pour indiquer si cette intervention est pensé ou dite à haute voix et direct pour indiquer s'il s'agit de style direct ou indirect. L'élément <quote> est quant à lui réservé au deuxième cas et ne possède pas d'attributs spécifiques. Voilà, pour la théorie, dans la pratique, la différence entre ces deux éléments n'est pas forcément évidente, par conséquent, il arriver bien souvent qu'on n'en choisisse une pour les deux cas. Lors des rencontres TEI, nous avons d'ailleurs été bien en peine de distinguer ces deux balises et j'avoue que la différence ne m'avait pas sauté aux yeux jusqu'à maintenant.

Il existe un troisième élément <cit> qui permet d'indiquer une citation d'un ouvrage suivi d'une référence bibliographique : <cit><quote>La citation de l'ouvrage</quote><bibl>La référence bibliographique</bibl>1</cit>.

Les tableaux

Un tableau sert à indiquer des données tabulaires. Cela paraît évident, mais vu les sites Web qui existent encore avec des mises en page réalisées avec des tableaux, ça ne fait pas de mal de le rappeler ;-) Comme pour un certain nombre de choses, les tableaux en TEI présentent à peu près le même fonctionnement qu'en HTML (en fait, chronologiquement, c'est l'inverse :-) ). Nous disposons de trois éléments :

  1. <table> pour indiquer un tableau

  2. <row>, l'équivalent de <tr>, pour une rangée

  3. <cell>, l'équivalent de <td>, pour la cellule

  4. <head> permet d'ajouter le titre du tableau et correspond en HTML à <caption>

Exemple en HTML :

<table>
<caption>Titre du tableau</caption>
<tr>
<td>première cellule de la première rangée</td><td>Seconde cellule de la première rangée</td>
</tr>
</table>

Exemple en TEI :

<table>
<head>Titre du tableau</head>
<row>
<cell>première cellule de la première rangée</cell><cell>Seconde cellule de la première rangée</cell>
</row>
</table>

En revanche, il n'existe pas comme en HTML des balises spécifiques pour séparer les rangées de d'en-tête (<thead>), les rangées du corps du tableau (<tbody>) et le pied de la table (<tfoot>). Mais, on dispose de l'attribut role qui permet d'indiquer cela. Dans ce cas-là, la TEI permet une nouvelle fois d'avoir plus de souplesse, car HTML part du principe que seule une rangée peut constituer une en-tête, alors qu'on pourrait considérer la première colonne comme l'en-tête du tableau.

Les images

Pour indiquer la présence d'une image, il faut utiliser l'élément <figure>. Mais, la difficulté dans l'utilisation de cet élément est de faire référence à l'URI de l'image. Il faut l'indiquer dans une entité XML indiquée dans la déclaration de la DTD ce qui est loin d'être pratique, vous en conviendrez. Par exemple :

Dans la déclaration de la DTD :

<!ENTITY figureexemple SYSTEM "chemin_vers_l'image" NDATA jpeg>

Dans le corps du texte :

<figure entity="figureexemple"><head>Titre de l'image</head><figDesc>Description de l'image</figDesc></figure>

Dans la porchaine version dite P5, on aura plus besoin de déclarer l'image dans une entité et cela donnera :

<figure><head>Titre de l'image</head><graphic url="chemin_vers_image"/><figDesc>Description de l'image</figDesc></figure>

Les liens

On dispose de deux éléments pour indiquer un lien :

  • <ptr/>, élément vide qui permet de marquer un point lié à un autre dans le document courant, le guidelines précise même « pure pointer ». L'attribut target précise un identifiant existant du document courant.

  • <ref> présente exactement le même principe, mais ce n'est pas un élément vide, mais la référence peut porter sur une portion de texte (commentaire ou texte additionnel)

Dans le cadre de P4, les éléments <xptr> et <xref> possède les mêmes principes mais font référence à des points dans des documents externes. Pour P5, si j'ai bien tout compris, l'introduction de la normes Xlink du W3C rend caduque <xptr> et <xref> et est remplacé par l'attribut href disponible dans tous les éléments, comme dans HTML.

Avec les trois précédents billets (sans compter l'introduction de cette série), vous disposez maintenant des connaissances nécessaires pour encoder des informations avec des structures « simples » : articles scientifiques, thèses, romans... Bon courage pour cette partie et on va aller un peu plus loin dans les arcanes de la TEI.

Je profite de ce billet pour vous signaler que j'ai ajouté dans la partie Écrits divers le texte et le diaporama de la communication que j'ai faite aux rencontres TEI à Nancy le 21 octobre dernier.

Quelques notes en passant

1 Je réserverai un sort à la référence bibliographique dans un prochain billet.

TEI Geekeries —