Les petites cases

Causeries

La montagne, ça vous calme !

Comme le veut la coutume , je vous souhaite à tous et à toutes une bonne et heureuse année 2008. J'espère qu'elle sera à la hauteur de vos espérances, pleine de joie, de bonheur et de réussite...

Afin de prolonger encore les vacances et avant d'attaquer sur les chapeaux de roue cette nouvelle année qui s'annonce passionnante à tous les points de vue, je voudrais partager avec vous une expérience qui m'a été donnée de vivre pendant mon séjour à la montagne. Pratiquant le ski depuis ma plus tendre enfance, j'ai eu la chance de participer à ce qui pourrait s'apparenter à un must pour tous les fans de cette discipline, à savoir une randonnée.

Le chemin de départ

Lire la suite...

Causeries Vacances — 

Verbatim Tim Berners-Lee

Pour finir ce week-end sous le signe du Web of data, je vous propose quelques extraits de l'excellente interview de Tim Berners-Lee dans le dernier numéro de la Recherche consacré à l'avenir d'Internet.

Sur le terme Web sémantique

Le terme sémantique prête un peu à confusion car la sémantique s'intéresse au sens du langage pour en déduire des constructions logiques. Du coup, certains ont pensé qu'il s'agissait d'un Web qui permettrait par exemple d'effectuer des recherches sur Internet en posant des questions sous forme de phrases, en langage naturel. Or ce n'est pas son but. En fait, nous aurions dû l'appeler dès le départ « Web de données ».

But du Web of data

[...] Créer un lien automatique pour relier les données qui sont stockées dans les différents fichiers et bases de données de nos ordinateurs. Actuellement, il faut utiliser des logiciels différents pour accéder à ces informations et on ne peut les comparer ensuite que manuellement.
[...]Il existe un énorme gisement de données enfouies dans tous les ordinateurs de la planète : en les reliant, le Web sémantique permettra d'exploiter cette mine pour améliorer nos connaissances dans de nombreux domaines.[...]

Lire la suite...

Web sémantique Causeries — 

Naviguer et rechercher dans le Web of data

Preuve supplémentaire de la maturité du Web of data, nous disposons, à l'instar de son grand frère le Web, de navigateurs et de moteurs de recherche spécialisés ne requérant aucune compétence particulière.

Petite revue de détail, en commençant par les navigateurs.

  • A tout seigneur, tout honneur, le premier d'entre eux mis au point par Tim Berners-Lee et son équipe : Tabulator développé en Javascript (Attention, ne fonctionne qu'avec Firefox). Outre la possibilité de naviguer dans des sources en RDF, il offre un moteur SPARQL, la possibilité d'afficher les données géographiques sur une carte, les événements sur un agenda ou une frise chronologique. C'est certainement le plus complet, mais aussi le plus geeky.
  • Dans le même ordre d'idée et proposant des fonctionnalités à peu près équivalentes, OpenLink RDF browser, qui sert de démonstration au produit Virtuoso server qui intègre, entre autres, un RDF store et sparql end point, de l'éditeur Open link software.
  • Plus simple et plus accessible, Disco hyperdata Browser mis au point par l'équipe de Dbpedia (ces types ne s'arrêtent jamais). L'interface est, disons, épurée, mais efficace. Fonctionnalité intéressante, il intègre un cache qui permet de disposer de tous les triples consultés récemment par les utilisateurs pour naviguer dans les sources RDF.
  • Pour finir, celui qui me semble le plus prometteur : Zitgist browser mis au point par Frederik Giasson. Aussi simple que Disco, mais avec une interface très agréable.

Lire la suite...

RDF Sparql Causeries Moteur de recherche Navigateur Linked Data —  3 commentaires

Retour sur Freebase à la lumière du Web of data

Au mois de mars, Tim O'Reilly repris par Internet Actu définissait ainsi le but de Freebase : « Créer les synapses du cerveau global ». On y voyait les prémices de la première application concrète et accessible à tous du Web sémantique. Six mois plus tard, je vous propose d'y revenir, alors que le concept de Web of data et Dbpedia ont fait leur apparition.

Dans l'article d'Internet actu, Hubert citait Denny Vrandecic, concepteur de Semantic Mediawiki :

« Metaweb [nda : le concepteur de Freebase et par extension le logiciel qui fait tourner freebase] vient du monde des données structurées, même si la structure est ici flexible et changeante. Semantic Media Wiki vient du monde des données non structurées, qui peuvent être améliorées par quelques éléments de structure pour mettre en relation plusieurs éléments non structurés. ».

Cette analyse me paraît excellente, car elle pose tous les enjeux de Freebase et son mode de fonctionnement. Si on voulait caricaturer, je dirais que Freebase est un wiki structuré OU une base de données dont la modélisation peut changer à la demande de l'utilisateur qui peut librement saisir les données. Choisissez votre camp en fonction de votre origine : données non structurées ou données structurées.

Concrètement, Freebase est organisée sous la forme d'une taxonomie thématique (arts et divertissements, Société, Sport...). Chaque thème comprend des types de ressource (film, acteur, opera, pièce de théâtre, Personne, ville...) auxquels sont rattachés des propriétés. Ces propriétés peuvent relier une ressource à une autre ressource ou à une donnée typée (chaîne de caractères, date, nombre entier...). Si vous suivez ce blog attentivement, vous aurez reconnu le principe d'une ontologie qui présente la particularité d'une structure évolutive à la demande des utilisateurs.

Cerise sur le gâteau, Freebase propose pour gérer cette ontologie une interface très agréable, facile à manipuler et qui permet très simplement d'éditer une donnée, d'en ajouter, de relier une ressource à une autre.

Réaction immédiate : c'est génial, c'est effectivement la première application du Web sémantique ! En apparence et au premier abord, tout y est et il faut l'avouer, c'est impressionnant. Mais, à y regarder de plus près, deux problèmes se posent : l'un est technologique et l'autre est, je dirais, cognitif.

Lire la suite...

Management de l'information RDF Sparql Causeries Wikipedia Linked Data — 

Data, web of data, hyperdata : vivent les données !

Le monde du Web sémantique est en pleine ébullition en ce moment. Il ne se passe pas une semaine sans qu'une nouvelle ne fasse sensation et dépasse le cercle restreint des initiés. La dernière en date est sans conteste l'annonce de l'ouverture en bêta restreinte du service Twine qu'il me tarde de découvrir. Cette agitation est alimentée par le buzz fait autour du concept de Web 3.0 que beaucoup assimile au Web sémantique, sans, bien souvent, savoir exactement à quoi il fait référence.

Mais, au-delà du buzzword, il existe une vraie évolution et une réalité. Les technologies du Web sémantique arrivent à maturité, des applications concrètes commencent à poindre leur nez et les données décrites en RDF font peu à peu leur apparition sur le Web. Plus que le pseudo-concept de Web 3.0, la période qui s'annonce devrait être marquée par les concepts que renferment les expressions "hyperdata" et "Web of data". Ces termes montrent la voie que prend actuellement le Web sémantique, plus proche des utilisateurs et de la vision de Tim Berners-Lee que des tenants de l'intelligence artificielle. Il faut alors se souvenir des mots de Jim Hendler en forme de Mea Culpa qui avouait son erreur en intégrant les technologies de l'intelligence artificielle dans le Web sémantique.

Il ne faut évidemment pas tomber dans l'extrémisme et oublier tous les apports que peuvent avoir certaines de ces technologies, mais il est aujourd'hui certain que le Web sémantique ne se créera pas à partir des fondations de l'intelligence artificielle mais plutôt du Web.

J'espère avoir le temps de revenir plus en détail sur les concepts d'hyperdata et de Web of data et leurs conséquences dans de prochains billets. Mais, avant cela, pour vous convaincre ou vous permettre de comprendre, je vous propose trois ressources indispensables

Lire la suite...

Management de l'information Web sémantique Causeries —  11 commentaires

L'information en révolution

Mike Wesch , à l'origine de la superbe vidéo sur le Web 2.0 The Machine is Us/ing Us, a mis à disposition une nouvelle vidéo intitulé Information R/evolution

Lire la suite...

Management de l'information Causeries Folksonomie — 

Des écrans à la chaîne

Il semblerait qu'une nouvelle chaîne a fait son apparition dans la blogosphère et Christian m'a introduit dans la boucle. Avec un peu de retard, je m'exécute, histoire aussi de reprendre en douceur les rênes de ce blog, que j'ai délaissé ces derniers temps.

Le principe est de proposer à ses lecteurs une copie d'écran de son bureau. Voici donc celui de mon ordinateur personnel

Lire la suite...

Causeries Perso —  2 commentaires

qu'est-ce-qui distingue le Web du Web sémantique ?

Les technologies du Web (HTML, XML, CSS...) ont pour but de structurer/afficher des documents et de relier ces différents documents par des liens non typés.

Les technologies du Web sémantique (RDF, SPARQL, RDFa...) ont pour but de structurer/définir les données/les messages des documents et de relier ces différentes données par des liens typés.

Tout est histoire de granularité...

Lire la suite...

Web sémantique Web Causeries —  12 commentaires

De la polysémie de "catégorisation" en recherche d'informations

A l'occasion de la lecture de l'article d'Olivier Ertzcheid, Gabriel Gallezot et Eric Boutin sur les perspectives documentaires sur les moteurs de recherche, je suis tombé sur le mot « catégorisation », j'imagine, pour définir la fonctionnalités des « termes associés » d'Exalead. Il s'avère que ce terme est une source d'ambiguïté permanente dans le domaine de la recherche d'informations, faisant référence à plusieurs fonctionnalités et plusieurs technologies différentes. Je vous propose de faire le point afin d'y voir plus clair.

Lire la suite...

Management de l'information Causeries Moteur de recherche —  1 commentaire

RDF pour les nuls

Préambule du 27 août 2007 : à la suite d'un bon billet de David sur RDF, je voulais ajouter en commentaire la référence vers ce billet que j'avais écrit le 8 septembre 2006 ; je me suis alors aperçu qu'il n'avait pas été récupéré lors de l'import de mon ancien blog. Comme j'avais un peu la flemme de rechercher dans mes archives persos, mon sauveur se nomme Internet Archive dont le crawler salutaire avait indexé cette page. Qu'il en soit remercié. Le voici donc republié en l'état, en espérant que les commentateurs de l'époque m'excuseront le fait que je ne récupère pas leur prose ;-).

Pour vous faire apprécier pleinement toute la substantifique moelle du prochain billet, je me suis dit qu'il serait peut-être utile de réexpliquer le principe général de RDF1. Je voulais rassembler toute cela en un billet, mais ça faisait un peu long, alors j'ai séparé les choses. Donc, ceux qui ont déjà tout compris, vous pouvez attendre sagement le prochain billet (promis, il devrait arriver dans la foulée), pour ceux qui voudraient une piqûre de rappel voire plus, je vous invite à lire cet essai d'explication pédagogique de RDF (vous me direz en commentaire si ça vous paraît clair).

Lire la suite...

RDF Causeries —  2 commentaires