Les petites cases

Causeries sur la TEI à l'autre bout du monde

Après Manue, c'est à mon tour de traverser l'Atlantique pour assister à un événement annuel en relation avec ma communauté. J'ai même poussé le vice à traverser le continent nord américain d'est en ouest jusqu'à Victoria, ville située au Canada dans la région de la Colombie britannique sur la côte pacifique à quelques centaines de kilomètres de Vancouver et ainsi rejoindre mes camarades, amis et collègues de la TEI pour l'assemblée générale annuelle des membres du consortium.

Après un périple de 16 heures, deux lignes de métro, un RER, trois avions et un bus pour finir, j'ai pour la première fois de ma vie mis le pied hors d'Europe et, même si le colloque ne me laisse pas le temps d'apprécier pleinement la ville, le peu que j'en ai vu ne me déçoit pas. Quant aux 12 heures d'avion, qui, je dois l'avouer, m'inquiétaient, ça a été l'occasion de survoler le Groënland, instant magique que je ne suis pas près d'oublier.

Mais, trêves de bavardages, je n'ai pas fait plusieurs milliers de kilomètres pour faire du tourisme (franchement quelle idée !!...), mais pour travailler (c'est bien plus sérieux ! ;-) ). L'assemblée générale de la TEI est l'occasion d'entendre des communications assez théoriques sur l'encodage, la TEI, son évolution, ses défauts, XML, son évolution, ses défauts et comment améliorer tout ça. Je dois avouer que c'est souvent fumeux et que la langue de Shakespeare ne m'aide pas, mais il y a parfois quelques bonnes idées, comme cette tentative de Liam Quin du W3C de détendre les chercheurs que nous sommes sur les questions que nous nous posons avant d'encoder un texte. Il appelle cela l'anxiété du balisage, auquel il ajoute l'anxiété de la trace qu'on veut laisser, l'analyse était bonne, mais les propositions décevantes. Je retiendrais aussi les idées de John Lavagnino du king's college qui a expliqué en quoi le langage de la TEI évoluait et comment l'étude de cette évolution, même inconsciente, pouvait aider à mieux organiser le guidelines.

Heureusement, les communications ne se limitent pas à des papiers théoriques et à des keynotes et nous avons eu le droit à quelques rapports d'expériences.

Stéphan Sinclair, développeur d'hyperpro, un outil d'analyse lexicale en ligne sur lequel j'étais tombé il y a quelques mois, et Anthony Sapp nous ont présenté leurs recherches dans le domaine de la visualisation d'informations. Ils nous ont présenté plusieurs interfaces dont deux ont retenu mon attention. La première est une expérience assez novatrice de lecture (non, je rassure mes lecteurs fans de Thursday next, il ne s'agit pas d'Ultraworld) des pièces de théâtre, puisque vous pouvez visualiser sur un ascenseur dans une colonne à droite la répartition des tirades des différents personnages, dans une colonne adjacente, le texte en lui même et dans une dernière partie une animation du mouvement des personnages représentées sous forme de rond. Mon explication ne me semble pas clair, désolé... La seconde est un outil de représentation de l'information sous forme de mandala. Il représente graphiquement les interactions entre différentes informations que vous déterminez non pas simplement sous forme de graphes, comme avec omnigator dont j'ai déjà parlé, mais aussi sous forme de mandala. L'outil reste à creuser, mais l'idée est assez intéressante.

En vrac, nous avons eu une présentation d'un projet de visualisation géographique de corpus encodés en TEI par l'université de Bergen, une présentation du logiciel XTF, un framework de publication de document XML mis au point par la bibliothèque de l'université de Californie dont Manue a parlé justement cette semaine et qui me fait furieusement penser à SDX et la présentation par Béatrice Pincemin (oui, je ne suis pas le seul Français et ça fait bien plaisir !) du corpus des droits de l'Homme en TEI et la démonstration d'un projet en cours sur le livre the yellow book qui propose des documents en Word au téléchargement et un tourne-page en flash ce qui a eu pour effet de rayer définitivement le projet de ma mémoire. Deux autres projets ont retenu plus particulièrement mon attention :

  1. L'inévitable communication sur les problèmes de l'overlapping et sur les moyens de représenter deux arbres XML dans un seul fichier XML (c'est à dire un seul arbre..), en particulier pour permettre la description physique d'un ouvrage et sa description logique. La solution proposée, cette fois-ci, est séduisante, mais cela s'arrête là. Michael Best et Peter van Hardenberg de l'université de Victoria proposent d'utiliser les namespaces pour différencier les deux arbres, de mettre en place chacun des arbres séparemment et ensuite de les mixer dans un seul fichier. Du point de vue de la représentation de l'information, c'est assez intéressant. Mais, outre le fait qu'un namespace XML a pour utilité d'indiquer quels schémas XML sont utilisés dans le fichier XML, leurs propositions est limité par les outils de traitement des fichiers XML, en particulier Xpath qui ne prévoit pas ce genre de cas.

  2. Le second est une recherche en cours en Allemagne pour la mise en place d'un Grid autour des textes. Ils ont mis au point une interface visiblement open-source pour permettre aux auteurs de travailler et l'architecture en grid permet de décentraliser les données, et ainsi d'augmenter les capacités de stockage et d'interrogation. Ça m'a fait penser à la proposition de Stéphane Pouyllau sur un data center pour les SHS en France mixé avec la réflexion de Pierre Mounier sur SHS 2.0. C'est à dire comment centraliser tout en décentralisant...

Ce matin (oui, il est 8h du matin ici et la journée n'est pas encore vraiment commencé) a lieu la réunion des SIG, des groupes d'intérêts particuliers qui doivent aider au développement de la TEI et la poster session pendant laquelle je vais présenter un poster sur les projets de l'École des chartes dans le domaine des sources historiques (encodées en TEI évidemment !), avant d'affronter cet après-midi les interventions de rigueur dans la vie d'une association, bilan moral, financier et élections... Bref, encore une longue journée en perspective !

Causeries TEI — 

Commentaires

Ce qui est aussi préaucupant c'est que nous passons notre temps à voyager sur le continant Nord Américain et bientôt dans le nord de l'Angleterre et qu'en france on fait des débats pour voir s'il faut faire des revues électoniques ! S.
Il y a dans ton papier de quoi faire quinze séances sur la TEI et son environnement ! merci de nous faire participer en direct. Par contre la relation de ton périple met à jour une caractéristique bien française : la méconnaissance de la géographie : la cote EST de l'amérique c'est l'atlantique et Victoria c'est sur la côte ouest !! jpd
Stéphane > Ne sois pas trop dur, je te sens énervé ;-) Mais, tu as raison, un décalage est en train de se creuser et surtout de grandir... En même temps, c'est agréable les voyages, j'aime bien l'Eurostar, je le prends au moins une fois par mois en ce moment :-)
jpd > De rien, ce serait bien si on pouvait faire quinze séances sur la TEI dans une institution française :-) et merci pour le signalement, j'ai corrigé. Je dois avouer que j'ai du mal avec ma gauche et à ma droite et avec mon est et mon ouest. En même temps, tout est à l'ouest de la France ;-)