Les petites cases

Geekeries

Les éditeurs et les métadonnées : ONIX

Avant de passer à l'étape finale de constitution de mon METS et donc de mon SIP, je me suis dit qu'il ne serait pas inutile de s'intéresser à ONIX. Il s'agit d'une grammaire XML mise au point par EdiTEUR, un groupe international d'éditeurs dont la vocation est de coordonner les initiatives et les standards pour le commerce électronique dans le domaine du livre.

Lire la suite...

Structuration XML Conservation Édition électronique Geekeries — 

PREMIS ou les prémices de la conservation numérique

PREMIS est l'acronyme de Preservation metadata : implementation strategies. Ce format, mis au point par un groupe de travail soutenu par OCLC et RLG, est destiné à proposer un « framework » des éléments principaux (« core ») pour la conservation du document numérique.

Lire la suite...

Structuration XML Conservation Édition électronique Geekeries —  1 commentaire

Quoi de neuf du côté de XML ces derniers temps ?

Pour vider un peu mon agrégateur, enlever les étiquettes sur les messages importants arrivés des listes de discussions dans mon thunderbird et compléter le tout avec quelques liens archivés dans mon delicious, je vous propose une petite pelote de liens concernant XML (garantie non exhaustive).

Tout d'abord, la nouvelle version de mes deux outils fétiches pour éditer ou traiter du XML :

Lire la suite...

TEI Xquery XSLT Geekeries — 

METS et tu mets tes fichiers dans des petites cases

Comme promis dans mes précédents billets, je vais partager avec vous mon utilisation des formats METS et PREMIS pour constituer les SIP (Submission information package, n'en déplaise aux esprits mal placés...), les paquets de versements dans notre entrepôt numérique de données suivant le modèle OAIS.

Lire la suite...

Structuration XML Conservation Geekeries —  10 commentaires

Mes vacances aux standards d'hiver

Dans mon travail, j'ai toujours cherché à allier la théorie à la pratique, car, selon moi, l'un ne va pas sans l'autre. Quand vous avez compris les concepts, la mise en pratique devient plus facile et la pratique peut alors alimenter de nouvelles approches dans vos recherches. Cette position n'est pas toujours facile à tenir dans le monde de la recherche et j'ai souvent du mal à faire comprendre que je ne suis pas qu'un technicien, mais qu'en tant que chercheur, la technique fait partie intégrante de mes recherches.

Lire la suite...

RDF Sparql OWL XSLT Geekeries — 

Sémantique et XHTML

Contrairement à ce que dit un abus de langage répandu, une page Web n'est pas sémantisée, lorsqu'elle est encodée selon la norme XHTML. Si je reprends la définition de Wikipedia, la sémantique est une branche de la linguistique qui étudie les signifiés, c'est à dire le sens des mots et d'après mon vieux Petit Larousse 1994, la sémantique désigne ce qui est relatif au sens, à la signification des unités linguistiques.

Lire la suite...

Structuration Web sémantique XHTML XSLT Geekeries —  2 commentaires

Un nouveau groupe de travail pour les interfaces Web enrichies au W3C

http://www.w3.org/2006/appformats/

Voici une annonce qui devrait ravir beaucoup de mondes à commencer par Fred Cavazza, Tristan Nitot, Laurent Jouanneau et d'autres. Le W3C annonce la constitution d'un groupe de travail pour la mise au point d'un langage pour les interfaces Web enrichies. Pour faire rapide (ça me changera ;-) ), il s'agit de mettre un peu d'ordre au milieu d'une offre de plus en plus importantes dans ce secteur. A la suite de XUL, inventé par la mozilla foundation pour les interfaces de leurs produits dont Firefox, Microsoft annonce XAML à la base du prochain Windows, et Macromedia propose quant à lui MXML.

Espérons que le W3C réussira dans son entreprise de s'appuyer sur l'existant (« This deliverable should be based on an existing application/UI format ») et qu'il n'est déjà pas trop tard...

A signaler que cette annonce fait aussi état d'un autre groupe de travail dont le but est le développement d'une API standard pour le développement des applications Web clientes et dont la première tâche sera la documentation de XMLHttpRequest à la base d'AJAX.

Via Le fil RSS des nouveautés du W3C

Lire la suite...

XML Web Geekeries — 

De la théorie à la pratique : l'ontologie du monde de Harry Potter

Dans mon précédent billet, j'ai tenté de définir ce qu'on entend par une ontologie dans le cadre du Web sémantique et de vous présenter le langage OWL. Or, tester est le meilleur moyen d'apprendre et de comprendre un langage informatique, j'ai donc créé une petite ontologie du monde de Harry Potter grâce à Protege. Je ne pense pas que je maintiendrai cette ontologie, ce n'est qu'un modeste exemple perfectible et contenant certainement des erreurs, mais il faut bien commencer par quelque chose.

Pourquoi Harry Potter ? Tout simplement, parce que j'ai commencé à apprendre OWL et à créer cette ontologie juste après avoir lu dévoré le dernier volume de la série, Harry Potter et le prince de sang mêlé. Finalement, grâce à mon collègue Nicolas (coucou, Nico ;-) ), j'ai appris que j'avais fait un clin d'œil à la série sans le savoir. En effet, the owl signifie en anglais chouette, or, c'est le nom dans la version originale des examens que passe Harry en cinquième année (« Buse » dans la traduction française), donc dans Harry Potter et l'ordre du phénix. Voilà pour l'anecdote.

J'ai donc créé et peuplé mon ontologie grâce à Protege avec l'aide précieuse

Lire la suite...

RDF OWL XSLT Geekeries —  18 commentaires

Définir une ontologie avec OWL

En philosophie, une ontologie désigne un « discous sur l'être en tant qu'être », c'est à dire d'après la définition donnée par wikipedia « l'étude des propriétés générales de ce qui existe ».

Lire la suite...

OWL Geekeries —  4 commentaires

TEI et les références bibliographiques

J'ai récemment regardé de plus près les éléments offerts par la TEI pour coder les références bibliographiques, à l'occasion d'une rencontre avec une stagiaire-conservateur de l'ENSSIB, Anne-Claire Bernaudin (que je salue amicalement, puisque c'est une lectrice de ce blog), qui encode dans le cadre de son stage une bibliographie en EADet qui voulait faire un comparatif avec TEI et MODS. Pour continuer ma saga de la TEI comme dirait Blogokat, je vais donc vous faire partager le fruit de nos découvertes.

Il existe trois éléments pour décrire une référence bibliographique :

  1. <bibl> contient une référence « vaguement » structurée, c'est à dire que les différents éléments de la référence peuvent être balisés ou non, au choix de l'encodeur ;

  2. <biblStruct> contient une référence très structurée, dans laquelle seules les éléments TEI spécifiques à la description bibliographique sont acceptés ;

  3. <biblFull> contient une référence très structurée qui utilise les éléments autorisés dans l'élément <fileDesc> du header, c'est à dire l'ensemble des éléments qui permettent de décrire un fichier TEI, pour encoder la référence

Lire la suite...

TEI Geekeries —