Les petites cases

XSLT

Du Web sémantique au web de données, 2ème partie : retour sur un des articles de Roger T. Pédauque

Dans un billet récent écrit à l'occasion des dix ans de XML, Jean-Michel Salaün regrettait que les pistes esquissés dans le second texte de l'initiative Roger T. Pédauque intitulé «  Le texte en jeu. Permanences et transformations du document  » n'aient pas été suivies. Et, pour cause me semble-t-il, si ce deuxième article, comme les deux autres d'ailleurs, apporte incontestablement des pistes de réflexion et certaines idées intéressantes, il comprend des contre-sens et des erreurs si manifestes qu'il n'est possible de s'en servir comme base de travail qu'après une critique attentive, sans compter sur le style que Jean-Michel Salaün lui-même dans le billet cité plus haut qualifie « d'un peu abscons » et que je qualifierais plus volontiers de charabia jargonnant.

A l'heure où le Web sémantique pointe avec plus de prégnance le bout de son nez, il n'est pas inutile de revenir sur ce texte, comme sur les deux autres, pour construire une nouvelle réflexion. C'était d'ailleurs leur but : susciter le débat et la réflexion, sans présager des évolutions futures et selon l'état de l'art du moment. Or, il semble bien qu'une nouvelle étape est sur le point d'être franchie, si ce n'est pas déjà le cas. A titre personnel, si, à l'époque de rédaction du texte, je n'étais pas en mesure de m'immiscer dans le débat, j'espère, aujourd'hui, pouvoir apporter ma pierre à l'édifice.

Avant d'entrer dans le vif du sujet, je voudrais rappeler, pour mémoire, que cette initiative avait été lancée par le réseau thématiques pluridisciplinaires dédié au document, le RTP-DOC d'où le pseudonyme Roger T. Pédauque pour signer les textes collectifs, placé sous le patronage de feu le département STIC du CNRS. L'objectif était de réfléchir selon une approche pluridisciplinaire à la notion de document dans le contexte des changements induits par le numérique.

Lire la suite...

Structuration RDF XML Causeries Indexation Moteur de recherche OWL TEI Validation XHTML Xquery XSLT —  7 commentaires

Et une pelote, une !!

Pour se remettre de toutes ces émotions, rien ne vaut une petite pelote de liens bien consistantes et hétéroclites.

Dans la série, les gourous du XML se mettent à bloguer. Après James Clark dont j'ai parlé dans la précédente pelote, Jenni Tennison, grande prêtresse du XSLT, a ouvert son blog et c'est tout aussi intéressant. Deux billets ont plus particulièrement retenu mon attention :

Lire la suite...

RDF Sparql Moteur de recherche XSLT Geekeries —  1 commentaire

Des nouvelles du monde XML

J'ai à nouveau mon agrégateur rempli de billets sauvegardés vu que ces derniers temps, j'ai plus fait le tri que lire réellement ce qui y passait. Il y a un moment où il faut se résoudre à vider tout cela. Commençons par les billets autour de XML.

Lire la suite...

Structuration Sparql Causeries TEI Xquery XSLT —  4 commentaires

Traiter un espace de nom par défaut avec XSLT 1.0

Il fait vraiment trop chaud pour bloguer, mais je vais faire un effort ce soir pour honorer une promesse que j'ai faite dans la journée. En guise de billet, je vous propose une petite astuce pour gérer en XSLT 1.0 les espaces de noms (namespaces) par défaut. J'ai mis deux bonnes heures avant de trouver la solution, cela évitera à d'autres de perdre autant de temps et d'après l'expérience de la journée, d'autres connaissent le même problème.

Lire la suite...

Édition électronique TEI XSLT Geekeries —  4 commentaires

Opération : vider l'agrégateur...

C'est pas le tout de partir en vacances, mais il faut faire le ménage dans l'agrégateur à son retour, même si je serais bien resté à la montagne : la neige était excellente, les pistes superbes et le panorama fantastique...:-(

Alors, pour finir le tri, voici une pelote de liens.

Dans la catégorie XML, deux articles comparent XSLT, le langage de transformations de XML et Xquery, le langage de requêtes de XML : « XSTL vs Xquery » et « Comparing XSLT 2.0 et Xquery ». La question des différences entre ces 2 langages risque d'être à la mode avec le passage au statut de recommandation de XSLT 2 et Xquery 1. Et, comme tous ces genres de débat, je sens que cela va tourner à la guerre des religions... (Via XML.com et PuriTAL). Dans la même catégorie, on notera la sortie d'une nouvelle Working Draft sur l'ensemble des éléments pour l'internationalisation (internationalization Tag set). Si j'ai bien compris, ce standard devrait être très important, car il va permettre d'indiquer quelle(s) partie(s) d'un document ou d'un schéma peut(peuvent) être traduite(s). A souligner qu'il s'agit de la première norme du W3C écrite au format ODD (One Document Does it all) mis au

Lire la suite...

Web Causeries Navigateur TEI XSLT —  2 commentaires

Quoi de neuf du côté de XML ces derniers temps ?

Pour vider un peu mon agrégateur, enlever les étiquettes sur les messages importants arrivés des listes de discussions dans mon thunderbird et compléter le tout avec quelques liens archivés dans mon delicious, je vous propose une petite pelote de liens concernant XML (garantie non exhaustive).

Tout d'abord, la nouvelle version de mes deux outils fétiches pour éditer ou traiter du XML :

Lire la suite...

TEI Xquery XSLT Geekeries — 

Mes vacances aux standards d'hiver

Dans mon travail, j'ai toujours cherché à allier la théorie à la pratique, car, selon moi, l'un ne va pas sans l'autre. Quand vous avez compris les concepts, la mise en pratique devient plus facile et la pratique peut alors alimenter de nouvelles approches dans vos recherches. Cette position n'est pas toujours facile à tenir dans le monde de la recherche et j'ai souvent du mal à faire comprendre que je ne suis pas qu'un technicien, mais qu'en tant que chercheur, la technique fait partie intégrante de mes recherches.

Lire la suite...

RDF Sparql OWL XSLT Geekeries — 

Propositions de stages : Web services, statistiques textuelles et ontologies

Comme les étudiants de l'Université technologique de Troyes n'ont pas l'air intéressés par les stages que je propose, je me suis décidé à les proposer ouvertement sur mon blog. Je propose donc deux stages rémunérés (500 € nets par mois) à l'École nationale des chartes pour une durée maximale de six mois. Ces stages sont parfaits pour un projet de fin d'études d'école d'ingénieurs ou pour des Master 2, mais je suis ouvert aux propositions.

Le premier stage a pour but le développement ou l'amélioration d'outils pour les chercheurs en histoire. D'après ce que j'ai prévu, deux tâches se dégagent :

  1. Créer des fonctionnalités supplémentaires au logiciel eXist : base de données XML native open source en java, qui permet de faire des interrogations en Xquery. Il faudra développer des fonctionnalités pour effectuer de la statistique textuelle (calcul des collocations, comptages de formes, emplacement des formes...) ;

  2. Mettre au point des Web-services en SOAP ou en REST pour permettre l'interrogation à distance d'une base de données bibliographiques et d'un dictionnaire. Il faudra aussi développer l'API qui permettra d'accéder facilement au web service.

Pour ce

Lire la suite...

Web sémantique Causeries Histoire OWL XSLT — 

Sémantique et XHTML

Contrairement à ce que dit un abus de langage répandu, une page Web n'est pas sémantisée, lorsqu'elle est encodée selon la norme XHTML. Si je reprends la définition de Wikipedia, la sémantique est une branche de la linguistique qui étudie les signifiés, c'est à dire le sens des mots et d'après mon vieux Petit Larousse 1994, la sémantique désigne ce qui est relatif au sens, à la signification des unités linguistiques.

Lire la suite...

Structuration Web sémantique XHTML XSLT Geekeries —  2 commentaires

De la théorie à la pratique : l'ontologie du monde de Harry Potter

Dans mon précédent billet, j'ai tenté de définir ce qu'on entend par une ontologie dans le cadre du Web sémantique et de vous présenter le langage OWL. Or, tester est le meilleur moyen d'apprendre et de comprendre un langage informatique, j'ai donc créé une petite ontologie du monde de Harry Potter grâce à Protege. Je ne pense pas que je maintiendrai cette ontologie, ce n'est qu'un modeste exemple perfectible et contenant certainement des erreurs, mais il faut bien commencer par quelque chose.

Pourquoi Harry Potter ? Tout simplement, parce que j'ai commencé à apprendre OWL et à créer cette ontologie juste après avoir lu dévoré le dernier volume de la série, Harry Potter et le prince de sang mêlé. Finalement, grâce à mon collègue Nicolas (coucou, Nico ;-) ), j'ai appris que j'avais fait un clin d'œil à la série sans le savoir. En effet, the owl signifie en anglais chouette, or, c'est le nom dans la version originale des examens que passe Harry en cinquième année (« Buse » dans la traduction française), donc dans Harry Potter et l'ordre du phénix. Voilà pour l'anecdote.

J'ai donc créé et peuplé mon ontologie grâce à Protege avec l'aide précieuse

Lire la suite...

RDF OWL XSLT Geekeries —  18 commentaires