Les petites cases

SemWeb Camp à Paris

En attendant la suite de la série sur le Web sémantique (je bute sur l'écriture du prochain billet...), un billet en forme de publicité.

Samedi 16 février à partir de 9h30 aura lieu le premier SemWeb camp à Paris à la Cantine (151 rue Montmartre, dans le 2ème arrondissement de Paris), qui est, entre autres, le nouveau « quartier général » de la FING, co-organisateur de cette manifestation avec la communauté Websemantique.org. Tout le monde est évidemment le bienvenu pour partager ce que vous souhaitez (en rapport avec le Web sémantique ;-) ), comme il est de règle dans un WebCamp.

L'ambition de ce premier rendez-vous est modeste. Il s'agit essentiellement de se rencontrer, de faire connaissance et de réfléchir à l'organisation de la communauté du Web sémantique en France et d'autres manifestations du même type de plus grande envergure. Ce sera aussi l'occasion pour tous ceux qui s'intéressent au Web sémantique, du débutant au confirmé de partager et de mieux en comprendre les différentes technologies et les enjeux. Un grand merci à Olivier qui a lancé l'idée de ce rassemblement

J'espère donc que je pourrai vous y rencontrer nombreux !

Lire la suite...

Web sémantique Causeries —  6 commentaires

Du Web sémantique au web de données, 1ère partie

Si le Web sémantique atteint aujourd'hui le grand public, au point que Techcrunch repris par Internet Actu se demande quelle en sera la killer application, il reste une notion souvent mal comprise, objet de méprises voire de fantasmes. Et, pour cause, le Web sémantique est à la rencontre de domaines diverses : l'intelligence artificielle, la linguistique, les sciences de l'information et le Web pour ne citer que les principaux. Cette interdisciplinarité en a constitué à la fois la force et la faiblesse. De ce point de vue, l'article de Tim Berners-Lee, Ora Lassila et Jim Hendler dans Scientific American en 2001 en est un symbole, constituant un premier essai de synthèse entre les apports des différentes disciplines. Pour passer de la théorie à la pratique, sept années auront été nécessaires. Sept années qui ont vu les usages du Web changer, les concepts se préciser, les technologies se mettre en place. Si, aujourd'hui, la synthèse semble en bonne voie d'achèvement, il me semble utile d'en étudier la genèse et l'évolution pour préciser le concept de Web sémantique et ses applications possibles.

Lire la suite...

Management de l'information Web sémantique Causeries — 

Pour en finir avec Raoul Glaber

Pour justifier les « racines chrétiennes de l'Europe », notre schroumpfissime s'est pris, une nouvelle fois, pour Raoul Glaber en faisant référence, je cite, au « long manteau d'églises » que l'on peut admirer en France. Après Guy Moquet, Jean Jaurès et d'autres, notre schroumpfissime et son nègre attitré se sont encore pris les pieds dans le tapis. Cherchant à faire la preuve d'une culture, qu'ils ne possèdent visiblement pas, ils se sont non seulement trompés dans leur citation, mais aussi dans sa signification. Il n'est d'ailleurs pas le seul, puisque, le lendemain, pensant rétablir la citation originale, Jean-Luc Mélenchon, sénateur PS et Nicolas Demorant, animateur de la tranche matinale sur France inter, parlent de « long manteau de cathédrales ».

Petit et rapide cours d'histoire médiévale pour en finir une bonne fois pour toutes avec cette allusion absconse.

Lire la suite...

Histoire Râleries —  5 commentaires

Google se met à FOAF

Alors que j'expliquais dans mon précédent billet en quoi FOAF constituait une réponse aux problèmes de contrôle des données personnelles et d'interopérabilité entre les services de réseaux sociaux, Google semble me donner raison avec la sortie d'une nouvelle API : Social graph API. Si Google a longtemps traîné des pieds avant de s'intéresser aux technologies du Web sémantique, nous étions beaucoup à penser qu'il ne leur faudrait pas énormément de temps le jour où il voudrait s'y mettre. Il semble que ce jour soit arrivé.

Qu'en est-il exactement ?

Pour faire simple, Social Graph API permet d'effectuer des requêtes sur les données indexées par Google et encodées avec FOAF, XFN (pour faire vite, l'équivalent de FOAF avec les microformats) et les profils publics de certains services comme MySpace. Grâce à cette API, vous pouvez, par exemple, retrouver les différentes personnes qui sont liées à vous par l'intermédiaire d'un FOAF ou d'un XFN, concaténer en un point unique les informations éparpillées entre vos différentes pages de profils des services auxquels vous êtes abonnés (cf. l'exemple de Plaxo Pulse)...

Lire la suite...

Web sémantique Causeries Indexation Moteur de recherche —  9 commentaires

La TEI : principes et fonctionnements

L'ADBS m'a donné l'occasion, la semaine dernière, de me replonger avec grand plaisir dans la TEI à l'occasion d'un 5 à 7. Le but ce cette séance était d'en présenter le principe et le fonctionnement. Ma présentation s'attache donc à montrer les particularités de la TEI et en quoi elle constitue une solution générique à l'encodage des textes en repartant des buts poursuivis par l'encodage et de la démarche particulière de sa conception.

Je me suis inspiré pour la mettre au point des documents, en particulier une présentation de Lou Burnard, Sebastian Rahtz et Matthew Driscoll faite à l'occasion d'une formation à Sofia, mis à disposition sur le nouveau site du consortium TEI dévoilé à l'occasion de son 20ème anniversaire et de la sortie en version finale de la nouvelle version, la P5.

Après toutes ces mois à m'intéresser à RDF, cela a aussi été une opportunité pour préciser dans mon esprit les différences entre RDF et XML et d'affiner mes réflexions sur le concept de texte et de document. Mais, c'est une autre histoire que j'espère pouvoir partager avec vous dans les semaines qui viennent, s'il me reste un peu de temps ;-)

Bonne lecture !

Lire la suite...

Causeries TEI — 

La montagne, ça vous calme !

Comme le veut la coutume , je vous souhaite à tous et à toutes une bonne et heureuse année 2008. J'espère qu'elle sera à la hauteur de vos espérances, pleine de joie, de bonheur et de réussite...

Afin de prolonger encore les vacances et avant d'attaquer sur les chapeaux de roue cette nouvelle année qui s'annonce passionnante à tous les points de vue, je voudrais partager avec vous une expérience qui m'a été donnée de vivre pendant mon séjour à la montagne. Pratiquant le ski depuis ma plus tendre enfance, j'ai eu la chance de participer à ce qui pourrait s'apparenter à un must pour tous les fans de cette discipline, à savoir une randonnée.

Le chemin de départ

Lire la suite...

Causeries Vacances — 

FOAF : le réseau social garanti sans pub !

Vous en avez marre des pubs intempestives de Facebook, vous n'arrivez plus à gérer à la fois vos profils sur Linked in et Viadeo, vous vous dites que Google a suffisamment d'informations sur vous pour ouvrir un compte sur Orkut et vous voulez garder l'entière maîtrise des informations en ligne vous concernant, car vous êtes néanmoins convaincu qu'une présence en ligne est essentielle. Alors, n'attendez plus, créez votre fichier FOAF, mettez le en ligne et participez à la construction du graphe global géant. Cerise sur le gâteau, vous disposerez avec SPARQL d'une API standard réellement ouverte pour accéder aux données, contrairement à d'autres...

Vous allez me dire que je vous ai déjà fait le coup, il y a deux ans et que FOAF n'a pas constitué la première brique annoncée du Web sémantique. Alors, qu'est-ce-qui a changé pour justifier un regain d'intérêt pour FOAF ?

Premièrement, les technologies, nous disposons de nombreuses implémentations qui commencent à devenir matures de RDF et de SPARQL dans différents langages : PHP, Java et autres... et des frameworks pour construire simplement des triples store RDF sont disponibles.

Deuxièmement, les données disponibles en RDF, cette année a été très riche dans la mise à disposition de données en RDF : geonames, Dbpedia, revyu... L'initiative « Linked data » a permis d'accélérer le mouvement pour la création du Web sémantique ou, plutôt, du Web of data et l'appropriation des technologies sous-jancentes.

Troisièmement, la montée en puissance des réseaux sociaux est indéniablement le principal argument qui plaide en faveur de FOAF. Les usages sont peu à peu apparus, mais aussi les limites. Les utilisateurs prennent peu à peu conscience des dangers que représentent la mise à disposition de leurs données personnelles dans des services centralisés dont le modèle économique repose presque exclusivement sur la publicité.

Lire la suite...

Web sémantique Blog Geekeries —  21 commentaires

Stocker les triples

Dans un précédent billet, Iamhondjack notait avec justesse en commentaire qu'il ne fallait pas dissocier SPARQL et SQL de manière aussi stricte que je pouvais le faire. Il appuie son propos sur l'expérience de D2R server qui permet d'interroger une base de données relationnelles en SPARQL grâce à un mapping entre la modélisation de la base de données relationnelles et le modèle de graphe. Dans la foulée, Christian pose la question essentielle à savoir la performance et le temps de réponse.

Il semble que la question du stockage des triples RDF soit dans l'air du temps ce qui est logique, eu égard, à l'intérêt grandissant du Web of data. Ainsi, même si Tim Berners-Lee donnait déjà des premiers éléments de réponse dès 1998 dans un document intitulé Relational Databases and the Semantic Web (in Design Issues), un workshop organisé par le W3C et intitulé « RDF Access to Relational Databases » a permis de faire récemment le point sur la question. Une des conclusions de ce workshop est la nécessité de mettre au point une procédure normalisée de benchmark pour les triple store RDF sur le modèle de TPC pour les bases de données relationnelles.

Lire la suite...

RDF Sparql Geekeries —  9 commentaires

Verbatim Tim Berners-Lee

Pour finir ce week-end sous le signe du Web of data, je vous propose quelques extraits de l'excellente interview de Tim Berners-Lee dans le dernier numéro de la Recherche consacré à l'avenir d'Internet.

Sur le terme Web sémantique

Le terme sémantique prête un peu à confusion car la sémantique s'intéresse au sens du langage pour en déduire des constructions logiques. Du coup, certains ont pensé qu'il s'agissait d'un Web qui permettrait par exemple d'effectuer des recherches sur Internet en posant des questions sous forme de phrases, en langage naturel. Or ce n'est pas son but. En fait, nous aurions dû l'appeler dès le départ « Web de données ».

But du Web of data

[...] Créer un lien automatique pour relier les données qui sont stockées dans les différents fichiers et bases de données de nos ordinateurs. Actuellement, il faut utiliser des logiciels différents pour accéder à ces informations et on ne peut les comparer ensuite que manuellement.
[...]Il existe un énorme gisement de données enfouies dans tous les ordinateurs de la planète : en les reliant, le Web sémantique permettra d'exploiter cette mine pour améliorer nos connaissances dans de nombreux domaines.[...]

Lire la suite...

Web sémantique Causeries — 

Naviguer et rechercher dans le Web of data

Preuve supplémentaire de la maturité du Web of data, nous disposons, à l'instar de son grand frère le Web, de navigateurs et de moteurs de recherche spécialisés ne requérant aucune compétence particulière.

Petite revue de détail, en commençant par les navigateurs.

  • A tout seigneur, tout honneur, le premier d'entre eux mis au point par Tim Berners-Lee et son équipe : Tabulator développé en Javascript (Attention, ne fonctionne qu'avec Firefox). Outre la possibilité de naviguer dans des sources en RDF, il offre un moteur SPARQL, la possibilité d'afficher les données géographiques sur une carte, les événements sur un agenda ou une frise chronologique. C'est certainement le plus complet, mais aussi le plus geeky.
  • Dans le même ordre d'idée et proposant des fonctionnalités à peu près équivalentes, OpenLink RDF browser, qui sert de démonstration au produit Virtuoso server qui intègre, entre autres, un RDF store et sparql end point, de l'éditeur Open link software.
  • Plus simple et plus accessible, Disco hyperdata Browser mis au point par l'équipe de Dbpedia (ces types ne s'arrêtent jamais). L'interface est, disons, épurée, mais efficace. Fonctionnalité intéressante, il intègre un cache qui permet de disposer de tous les triples consultés récemment par les utilisateurs pour naviguer dans les sources RDF.
  • Pour finir, celui qui me semble le plus prometteur : Zitgist browser mis au point par Frederik Giasson. Aussi simple que Disco, mais avec une interface très agréable.

Lire la suite...

RDF Sparql Causeries Moteur de recherche Navigateur Linked Data —  3 commentaires