Les petites cases

Attendre ou foncer ?

À force d'écouter l'orage gronder sans se déclarer vraiment, tu vas gâcher ta vie à attendre un malheur qui n'arrivera jamais.

Tonino Benacquista, Quelqu'un d'autre, éd. Folio, Paris, 2004, p. 201.

Lire la suite...

Causeries — 

Message de service

Mis à part mes éventuelles râleries et il ne manque pas de sujets en ce moment pour râler, ce blog ne sera pas mis à jour dans les prochains jours pour cause de bureau à finir de ranger (je vous rassure plus de peur que de mal malgré les déclarations alarmistes et fracassantes dans la presse...), une communication à préparer pour la semaine prochaine et des réunions en pagaille. Bref, la suite de METS et PREMIS dans deux semaines et vive le retour de vacances :-( !

J'en profite pour passer un petit message perso à Jean Berger : j'ai bien reçu ton message qui m'a fait énormément plaisir, je te réponds dès que possible.

Lire la suite...

Blog Causeries — 

Un CMS basé sur RDF ?

Les CMS (Content Management System) permettent d'organiser, créer, modifier, supprimer, publier/dépublier des documents. Pour résumer, ils servent à gérer et manipuler une collection de documents. Il en existe une multitude comme le montre la liste mise au point par Karl Dubost ou encore le site de comparaison des CMS CMSMatrix.

Lire la suite...

RDF Sparql Causeries —  5 commentaires

Structuration générale d'un fichier TEI

Comme nous l'avons vu, il n'existe pas une DTD TEI. Pour autant, tous les fichiers utilisant une DTD issue de la TEI possède la même structuration générale. Tout d'abord, comme tous les fichiers XML, un fichier utilisant une DTD issue de la TEI possède un élément racine qui encadre l'ensemble du fichier : l'élément <TEI.2> qui correspond à l'élément <html> en HTML/XHTML. Il se compose ensuite de deux parties :

Lire la suite...

TEI Geekeries — 

La force des wikipédiens

http://en.wikipedia.org/wiki/WP:ITAAW

Un journaliste américain a mené une expérience avec wikipedia : il a créé un article bourré d'erreurs et de fautes de frappe.

Comme le raconte Francis Pisani qui le reprend lui-même de News.com (vous allez pouvoir tout valider correctement comme ça ;-) ), son article a été corrigé 224 fois au cours des premières 24 heures et 149 fois pendant les 24 heures suivantes.

Lire la suite...

Causeries Validation Wikipedia — 

Calife à la place du...

Désolé, c'est pas sérieux, mais il y a longtemps que je veux faire cela. Comme le dit Olivier, Iznogoud convient parfaitement à Nicolas Sarkozy. Avec lui, tous les moyens sont bons. D'ailleurs, j'ai reçu hier son super mail de spam, quelqu'un l'aurait-il dénoncé à la CNIL ?

Mise à jour : Pierre que je remercie au passage a répondu à ma question en me signalant l'action de Fred Couchet qui a trouvé un petit nom à cette affaire : le sarkospam et qui donne régulièrement des nouvelles de l'affaire. Par ailleurs, Olivier adresse une lettre ouverte pleine d'humour à notre Iznogoud national.

Lire la suite...

Blog Causeries — 

De la perte de la naïveté de l'étudiant

Avec un étonnement mêlé de tristesse, il avait vu ses maîtres, pourtant brillants et savants, perdre leur temps en vaines querelles ou rivalités stériles portant sur des points de détail de la doctrine. Pire ! Il se jalousaient les uns les autres et allaient jusqu'à essayer de se voler leurs élèves. Ce comportement n'était-il pas décevant de la part de cerveaux aussi illustres ? Il avait même assisté à une véritable guerre entre docteurs laïques et docteurs des ordres mendiants, tout cela pour obtenir des chaires !

Lire la suite...

Causeries SHS —  1 commentaire

RDF par l'apprentissage : FOAF

J'avoue que j'ai encore du mal à comprendre tous les principes de RDF. Je me suis donc pris en main et pour découvrir ses potentialités et son fonctionnement, j'ai commencé par FOAF. Pour bien poser tous les concepts, quoi de mieux que de vous faire partager cette découverte.

Le principe de base de RDF

Comme son nom l'indique, Ressource Description Framework, RDF offre des outils pour décrire des ressources de n'importe quel type, du moment qu'elle est désignée par une URI. Il est basé sur le principe des triples : <SUJET> <PREDICAT> <OBJET>.

Si je prends un exemple simple, cela donne : « l'URL http://www.lespetitecases.net (le sujet) a :

  • pour titre (prédicat) : les petites cases (objet) ;

  • pour description (prédicat) : Fourre-tout personnel virtuel de Gautier Poupeau, alias Got (objet) ;

  • pour auteur (prédicat) : Gautier Poupeau (objet) ;

  • pour langue (prédicat) : le français (objet) ; »

Cette description de la page d'accueil de ce site peut s'exprimer au moyen d'un « vocabulaire » RDF nommé Dublin Core, qui est une norme de métadonnées qu'on peut aussi inclure dans du HTML. Le fichier obtenu incluant d'autres prédicats offerts par le

Lire la suite...

RDF Geekeries —  8 commentaires

La modularité de la TEI

Suite de la présentation de la TEI : voir « A la découverte de la TEI ».

Parler de DTD TEI ne signifie rien. En effet, la TEI n'est pas une DTD, mais un ensemble de recommandations (« Guidelines ») et d'éléments rassemblés en modules distincts (« tag sets ») dont l'utilisation et le choix forment une DTD particulière. Il n'existe donc pas une DTD TEI mais autant que les combinaisons de modules rendent possibles. Pour reprendre les mots de Lou Burnard, la TEI est un système extensible, modulaire et polymorphe constituant un modèle abstrait.

Autour d'un module-noyau (« core tagset ») rassemblant les éléments communs à tous les types d'information, s'organisent un jeu de base (« base tagset ») et des modules additionnels (« additional tagset »).

Sept jeux de base sont proposés :

  • TEI.prose pour les textes en prose ;

  • TEI.verse pour les textes en vers ;

  • TEI.drama pour les textes dramatiques : théâtre, scénario... ;

  • TEI.spoken pour la transcription d'interviews ;

  • TEI.dictionnaries pour les dictionnaires et les encyclopédies ;

  • TEI.terminology pour les fichiers terminologiques

  • TEI.general et TEI.mixed permet de combiner selon des modalités

Lire la suite...

TEI Geekeries — 

Comprendre le principe du Web sémantique et de RDF

Le Web sémantique est un concept développé par le W3C qui, pour faire vite, a pour but d'ajouter du sens au Web et de le rendre plus intelligent. Pour prendre un exemple simple, si je cherche dans un moteur de recherche ce site Web, je fais la requête « les petites cases ». En guise de résultat, le moteur va m'indiquer des sites qui parlent de cases à cocher par exemple. Ce qu'on appelle le bruit en recherche d'informations et qui désigne les résultats non pertinents sera conséquent1.

Lire la suite...

Web sémantique Indexation Geekeries —  1 commentaire