J'ai à nouveau mon agrégateur rempli de billets sauvegardés vu que ces derniers temps, j'ai plus fait le tri que lire réellement ce qui y passait. Il y a un moment où il faut se résoudre à vider tout cela. Commençons par les billets autour de XML.
J'ai à nouveau mon agrégateur rempli de billets sauvegardés vu que ces derniers temps, j'ai plus fait le tri que lire réellement ce qui y passait. Il y a un moment où il faut se résoudre à vider tout cela. Commençons par les billets autour de XML.
Les dernières semaines furent silencieuses sur ce blog, mais très studieuses dans la vraie vie.
Dans mon précédent billet, j´ai montré en quoi il existait dans un document XML plusieurs natures d´informations, que j´appelle réalité. La mise en lumière de ces réalités est d´autant plus difficile, lorsqu´on utilise les mêmes balises pour les structurer. C´est particulièrement vrai dans le cas d´une page Web.
Au moins trois réalités peuvent être identifiées dans le corps d´une page HTML (balise <body>) :
Depuis que nous nous sommes revus1 à Digital Humanities en juillet, Christian Vandendorpe2 et moi débattons du problème de l'encodage en XML des caractéristiques physiques d'un document.
Je pense qu'il ne faut pas penser en termes d'outils mais en termes d'informations.
http://www.la-grange.net/2006/10/01.html#skos
Cette phrase de Karl pourrait être le crédo de l'Information manager. Elle montre que la question de la gestion de l'information numérique est fondamentale dans l'environnement informatique actuel et démontre l'importance de personnes spécialisées dans cette question.
Comme toutes les bonnes choses ont une fin, je m'apprête dans quelques heures à quitter Victoria et à reprendre l'avion pour rentrer à Paris, des souvenirs, des idées, des pensées pleins la tête, comme à chaque fois que je repars d'un colloque.
Comme certains d'entre vous ont eu l'air d'apprécier mon précédent billet (Merci encore Jean-Paul), je m'en vais vous conter la fin de ces journées. En fait, cela va aller assez vite (j'en vois certains qui sont rassurés dans la salle). Je n'ai pas vraiment assisté à un SIG, pris par l'écriture de mon précédent billet et la perspective de la poster session. D'ailleurs, cette dernière s'est bien déroulée, le poster que j'avais fait a été apprécié (encore merci à Nico et Manue pour leur coup de main). Notre projet de numérisation des cartulaires numérisés a fait l'admiration des différents bibliothécaires présents qui se sont succédés pour savoir comment nous utilisions METS. Quant aux geeks de la TEI et aux chercheurs, c'est surtout theleme, notre manuel en ligne de sciences auxiliaires qui a retenu leur attention. Quant aux autres posters, je n'ai pas vraiment eu le temps de les voir et pour la plupart ils
Pourquoi toujours limiter la discussion sur l'édition électronique en SHS aux seules revues et autres archives ouvertes ? A ma connaissance, une des particularités des SHS est justement que les revues ne représentent qu'un des média pour la communication scientifique. L'écriture de monographie, de manuels, d'outils de recherches (inventaires, dictionnaires, bibliographies...) voire même, soyons fous, d'éditions critiques constituent des types de publications essentiels dans la carrière d'un chercheur. Alors, quand André Gunthert, relayé par Hubert Guillaud, fait un point alarmiste de l'édition électronique française en SHS en ne parlant que des revues, je suis désolé, mais ça a le don de m'énerver.
Que l'édition électronique coûte cher, peut-être même plus cher que le papier, je suis à peu près d'accord,
Parmi les grammaires XML existantes, il en existe trois qui se détachent pour encoder des textes : Docbook mis au point par Norm Walsh dont le but est d'encoder les manuels techniques, XHTML 2 (eh !
Lorsqu'on encode un fichier en XML, bien souvent, on ne prend pas le temps, avant de se lancer à proprement parler dans le codage, de réfléchir à une question simple, mais pourtant essentielle : qu'est-ce-qu'on veut encoder ? Cette question a l'air anodine, mais la réponse peut faire varier de façon très importante la structure du fichier et le choix des balises. Je voudrais essayer de montrer avec ce billet l'impact de cette question dans les stratégies d'encodage.
J'ai déjà fait allusion à plusieurs reprises au vocabulaire RDF, SKOS (Simple knowledge organisation system) sur ce blog. Développé sous l'égide du W3C, il a pour but la modélisation et la mise à disposition selon le principe de RDF des thésaurus, taxonomies, glossaires et autres vocabulaires contrôlés.