Les petites cases

Web sémantique

La diffusion du Web sémantique : priorité du W3C et de Tim Berners-Lee ?

Voilà une question qui me taraude depuis quelques semaines. Après avoir travaillé à la diffusion des standards permettant de faire des pages Web : XHTML/CSS, relayé dans ce travail par une importante communauté dont le WASP et la mozilla foundation ne sont que des représentants parmi d'autres, c'est à dire la brique de base du Web semantic stack, il me semble que le W3C veuille passer à la vitesse supérieure sur le Web sémantique. Plusieurs indices peuvent être relevés :

Lire la suite...

RDF Sparql Causeries Navigateur OWL — 

Mes vacances aux standards d'hiver

Dans mon travail, j'ai toujours cherché à allier la théorie à la pratique, car, selon moi, l'un ne va pas sans l'autre. Quand vous avez compris les concepts, la mise en pratique devient plus facile et la pratique peut alors alimenter de nouvelles approches dans vos recherches. Cette position n'est pas toujours facile à tenir dans le monde de la recherche et j'ai souvent du mal à faire comprendre que je ne suis pas qu'un technicien, mais qu'en tant que chercheur, la technique fait partie intégrante de mes recherches.

Lire la suite...

RDF Sparql OWL XSLT Geekeries — 

Comment organiser l'information pour y naviguer efficacement ? (3)

Ce billet constitue la suite et la fin des billets dédiés à la structuration de l'information et à la description de l'information.

L'organisation physique de l'information sur les ordinateurs

Il existe plusieurs manières de concevoir l'organisation de l'information :

  • l'organisation physique des fichiers sur une machine ;

Lire la suite...

Structuration RDF XML Sparql Causeries Folksonomie —  3 commentaires

Propositions de stages : Web services, statistiques textuelles et ontologies

Comme les étudiants de l'Université technologique de Troyes n'ont pas l'air intéressés par les stages que je propose, je me suis décidé à les proposer ouvertement sur mon blog. Je propose donc deux stages rémunérés (500 € nets par mois) à l'École nationale des chartes pour une durée maximale de six mois. Ces stages sont parfaits pour un projet de fin d'études d'école d'ingénieurs ou pour des Master 2, mais je suis ouvert aux propositions.

Le premier stage a pour but le développement ou l'amélioration d'outils pour les chercheurs en histoire. D'après ce que j'ai prévu, deux tâches se dégagent :

  1. Créer des fonctionnalités supplémentaires au logiciel eXist : base de données XML native open source en java, qui permet de faire des interrogations en Xquery. Il faudra développer des fonctionnalités pour effectuer de la statistique textuelle (calcul des collocations, comptages de formes, emplacement des formes...) ;

  2. Mettre au point des Web-services en SOAP ou en REST pour permettre l'interrogation à distance d'une base de données bibliographiques et d'un dictionnaire. Il faudra aussi développer l'API qui permettra d'accéder facilement au web service.

Pour ce

Lire la suite...

Web sémantique Causeries Histoire OWL XSLT — 

Structurer, décrire et organiser l'information (2)

Ce billet constitue la suite du billet dédié à la structuration de l'information (voir aussi le troisièmes billet : comment organiser l'information pour y naviguer efficacement ?).

Lire la suite...

RDF XML Causeries Indexation OWL —  1 commentaire

Structurer, décrire et organiser l'information (1)

On a tendance à confondre les trois actes recouverts par les verbes : structurer, décrire et organiser. S'il est incontestable que leur sens est proche, ces verbes désignent dans le processus de création de l'information sur le support numérique des actions qu'il est essentiel de différencier. S'ils ne sont pas dissociés, il existe des risques d'amalgames conduisant à des mauvais choix technologiques.

Je vous propose une série de trois billets permettant de faire le point sur ce problème :

Lire la suite...

Structuration Web sémantique XML Causeries

Sémantique et XHTML

Contrairement à ce que dit un abus de langage répandu, une page Web n'est pas sémantisée, lorsqu'elle est encodée selon la norme XHTML. Si je reprends la définition de Wikipedia, la sémantique est une branche de la linguistique qui étudie les signifiés, c'est à dire le sens des mots et d'après mon vieux Petit Larousse 1994, la sémantique désigne ce qui est relatif au sens, à la signification des unités linguistiques.

Lire la suite...

Structuration Web sémantique XHTML XSLT Geekeries —  2 commentaires

De la théorie à la pratique : l'ontologie du monde de Harry Potter

Dans mon précédent billet, j'ai tenté de définir ce qu'on entend par une ontologie dans le cadre du Web sémantique et de vous présenter le langage OWL. Or, tester est le meilleur moyen d'apprendre et de comprendre un langage informatique, j'ai donc créé une petite ontologie du monde de Harry Potter grâce à Protege. Je ne pense pas que je maintiendrai cette ontologie, ce n'est qu'un modeste exemple perfectible et contenant certainement des erreurs, mais il faut bien commencer par quelque chose.

Pourquoi Harry Potter ? Tout simplement, parce que j'ai commencé à apprendre OWL et à créer cette ontologie juste après avoir lu dévoré le dernier volume de la série, Harry Potter et le prince de sang mêlé. Finalement, grâce à mon collègue Nicolas (coucou, Nico ;-) ), j'ai appris que j'avais fait un clin d'œil à la série sans le savoir. En effet, the owl signifie en anglais chouette, or, c'est le nom dans la version originale des examens que passe Harry en cinquième année (« Buse » dans la traduction française), donc dans Harry Potter et l'ordre du phénix. Voilà pour l'anecdote.

J'ai donc créé et peuplé mon ontologie grâce à Protege avec l'aide précieuse

Lire la suite...

RDF OWL XSLT Geekeries —  18 commentaires

Définir une ontologie avec OWL

En philosophie, une ontologie désigne un « discous sur l'être en tant qu'être », c'est à dire d'après la définition donnée par wikipedia « l'étude des propriétés générales de ce qui existe ».

Lire la suite...

OWL Geekeries —  4 commentaires

L'appropriation et l'utilisation de RDF : un cercle vicieux ?

Avec le buzz autour du concept « vaporware » de Web 2.0, la légitimité du principe de Web sémantique n'est plus remise en cause. Un article sur le site Developper Works d'IBM déclare même « the future of the Web is semantic ». Pour le monde des bibliothèques aussi, la réflexion est en cours comme le démontre le billet de Manue et le commentaire de Yann suite à mon billet, un peu provocateur, je l'avoue, « Pourquoi utiliser une syntaxe XML pour les métadonnées ? ». Finalement, ce billet ne fait que renforcer mon interrogation sur les raisons de l'échec actuel de RDF.

Dans son billet, Manue demande aux geeks de prouver l'utilité de ces technologies. Ils ont déjà commencé à le faire comme en témoigne cette page dédiée aux bibliothèques numériques sur le site Semantic Web Advanced Developpment for Europe et le travail effectué sur SKOS en relation avec le thesaurus des archives nationales britanniques. Par ailleurs, comme le montre le site SchemaWeb, il existe de nombreux vocabulaires RDF et autres ontologies.

S'agirait-il d'un manque d'outils alors ? Peut-être. Pourtant Ontoware, un « sourceforge » spécialisé dans les logiciels utilisant les

Lire la suite...

RDF Sparql Causeries —