Les petites cases

Un automne de rencontres autour du Web sémantique

Il y a un temps pour tout : la découverte, la réflexion et l'expérimentation sur ce blog, le partage et la dissémination auprès de nouveaux publics au cours d'événements divers et le temps de l'accomplissement de projets mettant en œuvre ces différentes idées. Ainsi, le silence de ce blog trouve ses raisons dans d'autres activités non moins essentielles qui, à leur tour, vont alimenter de nouvelles réflexions. Mais, avant de vous en faire part et en guise de conclusion à cette riche période, je voulais partager avec vous les présentations qui ont ponctué mon automne.

La découverte du Ecommerce

La préparation d'une conférence pour le salon Ecommerce 2010 a été pour moi l'occasion non seulement de découvrir ce marché, dans lequel Antidot est actif depuis plusieurs années, mais aussi la richesse des perspectives pour les technologies du Web sémantique.

Si j'avais suivi les développements de SearchMonkey (dont, au passage, Yahoo a signalé l'arrêt dans le cadre de l'échange de technologies avec Bing) ou de Google Rich Snippet ou le travail de Martin Hepp autour de Good Relations ou du site Linked Open Commerce mis au point avec OpenLink Software, je n'avais pas vraiment réfléchi au fait que le Ecommerce faisait face à des problématiques pour lesquels, à l'instar d'autres domaines comme les bibliothèques, les technologies du Web sémantique étaient toutes désignées. Ces différents points ont, d'ailleurs, servi de base pour structurer notre présentation :

  • Optimiser le référencement des données du catalogue ;
  • Exposer les données du catalogue ;
  • Agréger des données hétérogènes ;
  • Décrire et organiser les informations ;

Pour prolonger cette première réflexion, nous avons initié sur le blog d'Antidot une série de billets sur la question dont le premier, « Web sémantique & E-Commerce - Enjeux », est d'ors et déjà disponible. Par ailleurs, ce sujet sera au cœur d'une des prochaines rencontres du Meetup Web sémantique de Paris (cf. ci-dessous).

Introduction aux enjeux du Web sémantique

Après plus de cinq ans de réflexions et de découvertes du sujet, j'avais finalement eu peu d'occasions de relever l'exercice difficile de la présentation devant un large public des enjeux du Web sémantique dans un temps très limité. L'automne m'en aura donné l'occasion à trois reprises avec des publics et selon des modalités différentes. Vous pourrez vous-même constater que, sans être exactement les mêmes, les diaporamas se ressemblent évidemment... Mais, cela me semble intéressant de les partager avec vous dans le même état que leurs présentations ou presque...

Le Co-lab Sémantique

La première occasion m'a été donnée par Emilie Ogez, responsable Marketing & Communication de Xwiki, qui m'a invité à faire une présentation dans le cadre d'une journée de restitution des travaux du consortium Scribo, le Co-lab sémantique. L'objectif était simple : présenter en une heure le Web sémantique et, de mon point de vue, défi partiellement relevé, il m'aura manqué un peu de temps que la maîtresse de cérémonie n'aura pas eu l'indulgence de m'accorder ;-) Je ne lui en tiendrai pas rigueur et je la remercie pour cette invitation qui a été l'occasion de revoir certains, de faire de nouvelles rencontres et de découvrir le travail mené par Nuxeo autour du projet IKS.

Les rencontres Wikimedia 2010

Wikimedia France est une association dont le « but est de soutenir la diffusion libre de la connaissance et, notamment, les projets hébergés par la Wikimedia Foundation ». Dans ce cadre, l'année 2010 a été marquée par la signature de plusieurs partenariats entre l'association et des institutions culturelles (BnF, Museum de Toulouse) pour mettre à disposition leurs données sur les sites de la Wikimedia Foundation (Wikisource ou Wikimedia Commons). Afin de prolonger ces initiatives, l'association a organisé deux jours de conférences sur le thème « Patrimoine culturel & Web collaboratif » les 3 et 4 décembre 2010 dans des locaux de l'Assemblée nationale avec couverture presse, belle reconnaissance de l'Institution vis-à-vis de Wikipedia et consorts encore conspués régulièrement. A cette occasion, j'étais invité à une table ronde intitulée « Métadonnées : cultures et pratiques de la normalisation ». J'ai abordé (en dix minutes...) les conditions pour assurer l'échange et l'interopérabilité des métadonnées/données structurées sur le Web, c'est-à-dire de montrer l'apport en la matière de la normalisation des technologies du Web sémantique.

Université d'hiver du TGE Adonis

L'université d'hiver du TGE Adonis a été l'occasion de présenter la version bêta d'Isidore, une plate-forme d'accès et de recherche aux données francophones des SHS disponibles en libre accès. Le sujet mériterait un billet à lui seul tant il est riche et il constitue pour moi un projet particulier, puisque j'ai eu la chance d'y participer depuis les prémices du projet jusqu'à sa réalisation. Mais, je vous réserve cela pour la sortie officielle prévue pour le début du printemps. Au delà du moteur de recherche qui présente lui-même quelques fonctionnalités originales (crawl du RDFa, extraction et classification automatique à partir de référentiels métiers en SKOS, normalisation des données...), Isidore présente une particularité de taille, puisqu'il constitue, à ma connaissance, le premier ensemble de données publiques françaises exposé selon les principes du Linked Data, soit pour cette version bêta, 30 millions de triplets reliées à Geonames, Rameau, Pactols, Lexvo, la catégorisation utilisée par HAL-SHS, Calenda...

Dans ce cadre, Jean-Luc Minel et Stéphane Pouyllau, les deux responsables du projet pour le TGE Adonis (que je remercie au passage pour la confiance qu'ils m'ont accordé tout au long de ce projet), m'avaient précisément demandé de présenter les enjeux du Linked Data ou Web de données et son application dans Isidore. Outre la présentation que vous trouverez ci-dessous, j'ai mis au point Isidore Term Navigator, une petite application en ligne de découverte et navigation du corpus d'Isidore à travers les concepts de Rameau qui s'appuie sur une interrogation du sparql endpoint d'Isidore (qui devrait être rendu public au cours du premier trimestre).

Le Meetup

Afin de promouvoir les technologies du Web sémantique en France, Antidot m'a donné la possibilité de mettre en place un groupe Meetup dédié : Les rencontres du Web de données qui rejoint les 80 groupes sur cette thématique à travers le monde. Ce groupe sponsorisé par le W3C (grâce aux bons soins d'Alexandre Monnin, Fabien Gandon et Marie-Claire Forgue, merci à eux) se propose de fédérer les énergies et les personnes qui travaillent dans ce domaine pour mieux présenter à tous les enjeux technologiques et stratégiques du Web sémantique. Même si Antidot a pris l'initiative de créer ce groupe, nous n'en avons pas le leadership unique et tout le monde peut l'utiliser pour organiser un événement. Quant à nous, nous avons pris l'engagement d'organiser une rencontre par trimestre.

Épaulé par Pierre Col, directeur marketing d'Antidot, j'ai organisé une première rencontre le 16 décembre dernier à l'Institut de recherche et d'Innovation autour du thème suivant : « Comment réconcilier le SI legacy et le Web par le Web sémantique ? » avec pour invité, Christian Fauré. Ce thème et la présence de Christian se sont imposés à moi comme une évidence après la parution d'un billet sur son blog intitulé « Les technologies relationnelles dans les systèmes d'information ». Dans ce billet, Christian explique pourquoi le Web et, surtout, ses principes sous-jacents entrent en contradiction avec le fonctionnement des DSI traditionnelles, en opposant les concepts de technologies relationnelles (le Web) et technologies de gestion (les applications du SI traditionnel). En conclusion de ce billet, Christian se demandait où se situaient les technologies du Web sémantique dans ce schéma. Il a ensuite poursuivi la réflexion dans un second billet : « Metastabilité et architectures logicielles » et au cours du meetup dont vous trouverez un résumé écrit par Pierre Col sur le blog d'Antidot.

Il y a beaucoup à dire sur les idées émises par Christian et j'espère pouvoir apporter sur ce blog ma pierre à la réflexion en cours. Au delà des réponses, des questions et des polémiques que la communication de Christian a engendrées, un point me paraît particulièrement intéressant : sa réflexion ne donne pas de solutions toutes faites, de discours marketing pré-machés ou d'éléments de langages, elle donne des pistes pour comprendre pourquoi le Web sémantique a failli jusqu'à maintenant et vers quoi il faut tendre pour l'introduire peu à peu dans les organisations, c'est à chacun d'intégrer à son niveau la large palette des idées qu'il a émises pour mieux restituer et disséminer demain. Il me semble qu'en la matière, Christian était la personne idéale pour débuter ce cycle de rencontres et que le but que je lui avais fixé a été atteint.

D'autres rencontres seront bientôt organisées. Alexandre Monnin en prépare une pour la fin du mois de janvier autour d'Henry Story sur les rapports entre le Web sémantique et les réseaux sociaux. De notre côté, nous organiserons une rencontre au mois de mars sur les rapports entre Open Data et Linked Data ou sur Ecommerce et Web sémantique. Si vous êtes intéressés et que vous souhaitez être tenu au courant de ces rencontres, n'hésitez pas à vous inscrire sur le site Meetup et/ou sur la liste de discussions francophones du Web sémantique hébergée (depuis cet été) par l'INRIA.

SemWeb.pro

Logo de SemWeb.pro Pour finir, je ne pourrais pas être exhaustif si je n'abordais pas les futurs rencontres et, en premier lieu, Semweb.pro. A l'initiative de Nicolas Chauvat, PDG de la société logilab, SemWeb.pro constitue les premières journées professionnelles du Web sémantique et a vocation à rassembler pendant deux jours, les 17 et 18 janvier prochain à Paris, la communauté scientifique, les industriels et les organisations publiques intéressés par le Web sémantique. Le programme est composé d'une première journée de conférence au cours de laquelle se succèderont Ivan Herman, responsable de l'activité Web sémantique au W3C et des représentants de Google, Ericsson, Semsoft, Logilab, Antidot, la BBC... et d'une seconde journée de tutoriels par les principaux acteurs de la normalisation du Web sémantique au W3C. J'aurais ainsi l'immense honneur de coordonner deux tutoriaux en compagnie d'Alexandre Passant sur SPARQL et d'Ivan Herman sur RDFa. Si vous souhaitez suivre une rapide formation sur les technologies du Web sémantique, vous ne pourrez pas trouver un meilleur rapport qualité-prix ;-)

Management de l'information RDF Web sémantique Sparql Causeries Digital humanities Moteur de recherche RDFa Wikipedia Linked Data — 

Commentaires

Merci pour ce bon billet Gautier ...
Quelques remarques pour compléter la partie Web sémantique et e-commerce. Je suis d'accord avec toi que ces technologies ont beaucoup à apporter, notamment pour optimiser le référencement et l'indexation des produits et des offres associées des sites marchands mais il faudrait aussi modérer l'optimisme ambiant avec la réalité des chiffres:

1/ Très très peu de pages crawlées par Google ont du markup sémantique et quand il y en a, on trouve plutôt du hProduct que du GoodRelations, voir cet article [1] ou cette présentation [2]. Peter Mika our Yahoo! a des statistiques un peu différentes à [3] mais non contradictoires.

2/ Martin Hepp est un évangéliste et c'est important d'en avoir, mais Good Relations est loin d'être exempt de critiques. Les développeurs les plus afutés au Web Sémantique continuent de le trouver compliqué à adopter et à implémenter [4], parce que le modèle se concentre sur la notion d'offre plutôt que de la description des produits associés.

En espérant pouvoir aborder cela ainsi que la réalité (parfois cruelle) des chiffres concernant l'adoption de telles ou telles ontologies au prochain meetup ;-)

Raphaël

[1] How Google is using Linked Data Today and Vision For Tomorrow. http://www.eurecom.fr/~troncy/Publications/Steiner_Troncy_Hausenblas-fia...
[2] https://docs.google.com/present/view?id=dgdcn6h3_185g8w2bdgv
[3] http://www.slideshare.net/pmika/the-role-of-linked-data-in-search-and-on...
[4] http://twitter.com/moustaki/status/15700079872581633

Merci Gautier pour ce compte rendu !
Je l'avais depuis 2 mois dans mes perles à lire, j'ai enfin trouvé le temps ;)

Pour l'instant mes activités me permettent pas de vous rejoindre dans vos meetups, c'est donc un vrai plaisir d'avoir ce genre de compte rendu qui synthétise bien l'état de la scène française.

Sinon pearltrees vient de dépasser les 4 millions de perles éditées, j'ai hate que l'API soit à l'engenda (peut être même cette année). Il faudra qu'on se parle à ce moment là pour faire ça bien ;)

A bientôt,
N.