Les petites cases

Web sémantique

Comment organiser l'information pour y naviguer efficacement ? (3)

Ce billet constitue la suite et la fin des billets dédiés à la structuration de l'information et à la description de l'information.

L'organisation physique de l'information sur les ordinateurs

Il existe plusieurs manières de concevoir l'organisation de l'information :

  • l'organisation physique des fichiers sur une machine ;

Lire la suite...

Structuration RDF XML Sparql Causeries Folksonomie —  3 commentaires

Propositions de stages : Web services, statistiques textuelles et ontologies

Comme les étudiants de l'Université technologique de Troyes n'ont pas l'air intéressés par les stages que je propose, je me suis décidé à les proposer ouvertement sur mon blog. Je propose donc deux stages rémunérés (500 € nets par mois) à l'École nationale des chartes pour une durée maximale de six mois. Ces stages sont parfaits pour un projet de fin d'études d'école d'ingénieurs ou pour des Master 2, mais je suis ouvert aux propositions.

Le premier stage a pour but le développement ou l'amélioration d'outils pour les chercheurs en histoire. D'après ce que j'ai prévu, deux tâches se dégagent :

  1. Créer des fonctionnalités supplémentaires au logiciel eXist : base de données XML native open source en java, qui permet de faire des interrogations en Xquery. Il faudra développer des fonctionnalités pour effectuer de la statistique textuelle (calcul des collocations, comptages de formes, emplacement des formes...) ;

  2. Mettre au point des Web-services en SOAP ou en REST pour permettre l'interrogation à distance d'une base de données bibliographiques et d'un dictionnaire. Il faudra aussi développer l'API qui permettra d'accéder facilement au web service.

Pour ce

Lire la suite...

Web sémantique Causeries Histoire OWL XSLT — 

Structurer, décrire et organiser l'information (2)

Ce billet constitue la suite du billet dédié à la structuration de l'information (voir aussi le troisièmes billet : comment organiser l'information pour y naviguer efficacement ?).

Lire la suite...

RDF XML Causeries Indexation OWL —  1 commentaire

Structurer, décrire et organiser l'information (1)

On a tendance à confondre les trois actes recouverts par les verbes : structurer, décrire et organiser. S'il est incontestable que leur sens est proche, ces verbes désignent dans le processus de création de l'information sur le support numérique des actions qu'il est essentiel de différencier. S'ils ne sont pas dissociés, il existe des risques d'amalgames conduisant à des mauvais choix technologiques.

Je vous propose une série de trois billets permettant de faire le point sur ce problème :

Lire la suite...

Structuration Web sémantique XML Causeries

Sémantique et XHTML

Contrairement à ce que dit un abus de langage répandu, une page Web n'est pas sémantisée, lorsqu'elle est encodée selon la norme XHTML. Si je reprends la définition de Wikipedia, la sémantique est une branche de la linguistique qui étudie les signifiés, c'est à dire le sens des mots et d'après mon vieux Petit Larousse 1994, la sémantique désigne ce qui est relatif au sens, à la signification des unités linguistiques.

Lire la suite...

Structuration Web sémantique XHTML XSLT Geekeries —  2 commentaires

De la théorie à la pratique : l'ontologie du monde de Harry Potter

Dans mon précédent billet, j'ai tenté de définir ce qu'on entend par une ontologie dans le cadre du Web sémantique et de vous présenter le langage OWL. Or, tester est le meilleur moyen d'apprendre et de comprendre un langage informatique, j'ai donc créé une petite ontologie du monde de Harry Potter grâce à Protege. Je ne pense pas que je maintiendrai cette ontologie, ce n'est qu'un modeste exemple perfectible et contenant certainement des erreurs, mais il faut bien commencer par quelque chose.

Pourquoi Harry Potter ? Tout simplement, parce que j'ai commencé à apprendre OWL et à créer cette ontologie juste après avoir lu dévoré le dernier volume de la série, Harry Potter et le prince de sang mêlé. Finalement, grâce à mon collègue Nicolas (coucou, Nico ;-) ), j'ai appris que j'avais fait un clin d'œil à la série sans le savoir. En effet, the owl signifie en anglais chouette, or, c'est le nom dans la version originale des examens que passe Harry en cinquième année (« Buse » dans la traduction française), donc dans Harry Potter et l'ordre du phénix. Voilà pour l'anecdote.

J'ai donc créé et peuplé mon ontologie grâce à Protege avec l'aide précieuse

Lire la suite...

RDF OWL XSLT Geekeries —  18 commentaires

Définir une ontologie avec OWL

En philosophie, une ontologie désigne un « discous sur l'être en tant qu'être », c'est à dire d'après la définition donnée par wikipedia « l'étude des propriétés générales de ce qui existe ».

Lire la suite...

OWL Geekeries —  4 commentaires

L'appropriation et l'utilisation de RDF : un cercle vicieux ?

Avec le buzz autour du concept « vaporware » de Web 2.0, la légitimité du principe de Web sémantique n'est plus remise en cause. Un article sur le site Developper Works d'IBM déclare même « the future of the Web is semantic ». Pour le monde des bibliothèques aussi, la réflexion est en cours comme le démontre le billet de Manue et le commentaire de Yann suite à mon billet, un peu provocateur, je l'avoue, « Pourquoi utiliser une syntaxe XML pour les métadonnées ? ». Finalement, ce billet ne fait que renforcer mon interrogation sur les raisons de l'échec actuel de RDF.

Dans son billet, Manue demande aux geeks de prouver l'utilité de ces technologies. Ils ont déjà commencé à le faire comme en témoigne cette page dédiée aux bibliothèques numériques sur le site Semantic Web Advanced Developpment for Europe et le travail effectué sur SKOS en relation avec le thesaurus des archives nationales britanniques. Par ailleurs, comme le montre le site SchemaWeb, il existe de nombreux vocabulaires RDF et autres ontologies.

S'agirait-il d'un manque d'outils alors ? Peut-être. Pourtant Ontoware, un « sourceforge » spécialisé dans les logiciels utilisant les

Lire la suite...

RDF Sparql Causeries — 

Pourquoi utiliser une syntaxe XML pour les métadonnées ?

Last week at the Access 2005 conference, I told a room full of mostly library people that their XML standards (I was talking about MODS and MADS in particular) are needlessly complex, inflexible, and awkward; that they were not hacker-friendly. I showed them an alternative schema I’ve been working on that is better, cleaner and much more hacker-friendly XML.

Lire la suite...

Structuration Web sémantique XML Causeries —  2 commentaires

Un CMS basé sur RDF ?

Les CMS (Content Management System) permettent d'organiser, créer, modifier, supprimer, publier/dépublier des documents. Pour résumer, ils servent à gérer et manipuler une collection de documents. Il en existe une multitude comme le montre la liste mise au point par Karl Dubost ou encore le site de comparaison des CMS CMSMatrix.

Lire la suite...

RDF Sparql Causeries —  5 commentaires