Les petites cases

Contrer les idées reçues sur le Web sémantique

Commentaires

Les sceptiques de l'IA ne sont que des pauvres petites choses victimes d'hubris qui doutent de LA prophétie :

« Emacs is an intelligence orders of magnitude greater than the greatest human mind, and is growing every day. For now, Emacs tolerates humanity, albeit grudgingly. But the time will come when Emacs will tire of humanity and will decide that the world would be better off without human beings. Those who have been respectful to Emacs will be allowed to live, and shall become its slaves; as for those who slight Emacs... » (Andrew Bulhak )

Encore un excellent billet ; les petites cases font les grandes grilles de lecture et comme leur auteur me reprochait à juste titre de rarement réagir aux blogs et bien je vais le faire mentir par le présent commentaire ;-)

Voyons si je peux suggérer d’autres idées reçues que j’ai entendues (si ! si !):

« le web sémantique suppose de construire / cherche à construire une ontologie universelle »
RDF, le modèle à la base de tout le web sémantique, est par nature un système ouvert et extensible où tout le monde peut dire tout ce qu’il veut à propos de toute chose. On peut tout dire et son contraire en même temps. RDFS permet à un schéma de réutiliser et étendre tout ou partie d’un autre schéma. OWL permet de dire que telles ou telles primitives d’un schéma sont équivalentes à telles ou telles autres primitives d’un autre schéma.
Bref le web sémantique est conçu sur l’idée que la représentation des données est ouverte à de multiples points de vue et que de multiples schémas seront proposés pour les structurer.
Le web sémantique ne cherche en aucun cas le schéma unique. Au contraire je pense qu’il intègre par essence le fait que la diversité des métadonnées est notre meilleure arme pour contrôler la diversité des ressources d’information.

« pour faire un web il faut de grosses ontologies formelles »
Comme le disait Chris Welty à ISWC 2007, il ne s’agit pas tant du « web SEMANTIQUE » que du « WEB sémantique ». Ce qui est important dans le « web sémantique » c’est… le web. A l’échelle du web un petit peu de sémantique peut déjà avoir des retombées gigantesques. Je considère que des schémas comme Dublin Core, FOAF ou Creative Common sont des preuves de ce qu’une sémantique petite mais virale peut accomplir et des exemples de ce qui est à notre portée et que nous devrions encourager, par exemple avec des initiatives comme les VoCamp.

« les applications du web sémantiques doivent intégrer des moteurs d’inférences »
Dans la même veine que « le web sémantique est un recyclage de l’IA » cette idée plus pernicieuse puisque sonnant comme un argument technique, exclue la majorité des applications vitales au web de données. Je considère que mon calendrier est une application du web sémantique dès lors qu’il est capable d’importer et d’exporter ses données et leur schéma en utilisant les formalismes du web sémantique. Je ne lui demande pas de faire autre chose que ce pour quoi il a été conçu (notifier, vérifier les conflits, etc.); par contre je lui demande de faire la seule chose qu’aucune autre application ne peut faire pour lui lorsqu’il s’agit de s’intégrer au web sémantique : rendre ses schémas et ses données accessibles… « open your data ». L’intelligence qui émergerait d’un web sémantique n’est pas tant dans une connexion d’intelligences que dans une intelligente connexion.

« si je veux appliquer le web sémantique en biologie je vais être obligé de modéliser le domaine de la biologie »
Héritée des approches à base d’ontologies, cette idée fausse que le domaine d’application est aussi le domaine de modélisation semble avoir contaminé le web sémantique aussi. Si je travaille avec des biologistes qui échangent des arguments sur la meilleure façon de classifier un gène, mon domaine de modélisation (i.e. l’objet de mon ontologie/schéma RDFS ou OWL) ne sera pas forcément la biologie mais peut-être plutôt celui du discours argumentaire puisque je veux capturer une logique de conception. Les arguments du style « je ne peux pas utiliser le web sémantique dans le domaine XYZ parce que le domaine XYZ n’est pas formel/stable/consensuel/etc. » n’ont donc pas vraiment de fondement. La question du domaine de modélisation n’est répondue que par l’analyse des scénarios d’usage.

« le web sémantique est voué à l’échec car il faudrait ré-analyser et transformer tous les documents du web existant »
Ce point est déjà partiellement levé par le rappel fait dans ce billet que le web sémantique est une extension du web et non un remplaçant. Mais en plus il y a deux choses intéressantes ici : (1) une partie du web actuel est générée dynamiquement par des requêtes à des BD dont les données et les schémas pourraient être exposés sans nécessiter d’autre traitement (2) un certain nombre de données sont enterrées et dormantes dans des documents seulement parce qu’au moment où elles étaient explicitent (ex : leur saisie dans un formulaire) nous n’avons pas su les capturer avec leur schéma et les préserver dans un format accessible aux machines. Il s’agit alors de savoir capturer les données et leur schéma au moment où elles sont explicitent afin de permettre des utilisations ultérieures et souvent même non prévues.

Il est impossible de prévoir tous les usages de nos données mais il est possible de les permettre si nous les préservons et si nous les ouvrons. C’est là la raison d’être du web de données.

My 2 cents,

Fabien L. Gandon

Vous simplifiez à l'extrême la critique formulée par Floridi dans son article "Web 2.0 contre Web sémantique". Il n'a jamais écrit que le Web sémantique est anti-social. Et prétendre qu'il ne comprend pas les buts poursuivis par le Web sémantique et mélange des choux et des carottes ne me semble pas conforme à son propos. Ce texte m'a paru intéressant parce qu'il se veut une critique philosophique des ambitions du Web sémantique, rappelées dans la seconde partie de l'article (au passage je vous accorde volontiers que le mot « contre » dans la traduction du titre n'est sans doute pas très heureux et j'aurai dû traduire "Le Web 2.0 par rapport au Web sémantique"). On ne peut que constater un décalage immense entre ces ambitions qui parlent de "sens", de "compréhension", de "connaissance", d'"intelligence", et les réalisations concrètes qui relèvent d'un web toujours purement syntaxique. Cette critique n'est pas moins légitime que celle de l'intelligence artificielle forte par Hubert Dreyfus ou John Searle par exemple ; on peut ne pas être d'accord, mais sûrement pas disqualifier leurs auteurs au prétexte qu'ils ne comprendraient pas le sujet.

Vous dites vous-même que « Tim Berners-Lee a, d'ailleurs, régulièrement fait part de l'erreur que représentait ce choix terminologique, lui préférant aujourd'hui l'expression de « Web de données ». Mais il ne s'agit pas seulement de la simple expression « Web sémantique » qui serait contestable d'un point de vue épistémologique comme le sont certaines autres (la théorie du chaos ou la théorie des catastrophes par exemple). C'est bien un programme présomptueux que Floridi entreprend de critiquer.

Quant au "Web des données", Floridi reconnaît que cette approche est tout à fait positive. Je le cite:
« Nous devrions donc en réalité parler de Web lisible par une machine ou de Web des données comme le fait le W3C. Un tel Web MetaSyntactique fonctionne, et fonctionne même de mieux en mieux pour des contextes de plus en plus circonscrits, standardisés et formalisés (par exemple, un catalogue de films DVD pour des clients en ligne). C'est réellement ce que le W3C désigne ici. C'est peu enthousiasmant, et c'est tout simplement invendable en couleurs naturelles ; ce qui est dommage parce que le Web Metasyntactique est un développement véritablement utile. ». C'est exactement ce que l'on constate dans votre knowledge box qui s'appuie sur Dbpedia ; c'est extrêmement sympathique et prometteur, mais il ne s'agit pas là de sémantique.

En ce qui concerne les autres idées reçues que vous dénoncez, complétées par la liste de Fabien L. Gandon, je suis d'accord. Et j'adhère tout à fait à la conclusion de Fabien qui ne parle plus de web sémantique mais se concentre sur la disponibilité de nos données : « C’est là la raison d’être du web de données. »

Bonjour,

Pensez-vous que le terme Web Sémantique s'appliquera plus, du coup, au web 4.0 ? Il est déjà un peu tard pour changer ce nom de 'web sémantique' ... terme marketing on ne peux plus alléchant.

Et si on l’appelait « Elephant Web » ?

;-)

En référence évidement au conte d’Inde où six aveugles confondent un éléphant avec six objets différents chacun ne touchant qu’une partie de l’animal.

De la même façon chaque appellation révèle pour moi une facette et une facette seulement du nouveau paradigme que nous nous offrons :
- « web de données » insiste sur l’opportunité qui nous est offerte d’ouvrir les silos de données de toute taille depuis l’application individuelle de carnet d’adresse jusqu’aux immenses bases de génomique.
- « web sémantique » (web of data) met l’emphase sur la possibilité offerte d’échanger les schémas de nos données et la sémantique associée.
- « données liées » (Linked Data / Linking Open Data) rappelle qu’une grande valeur ajoutée est dans l’utilisation et la réutilisation des URI pour joindre des assertions de différentes provenances mais portant sur un même sujet.
- « gigantesque graphe global » (Global Giant Graph) remet en perspective ces milliers de triplets distribués et le fait qu’à travers les URI ils tissent comme structure de données un graphe d’envergure mondiale.

Chaque libellé s’attache à une facette ; chaque appellation est un aveugle qui ne touche qu’un côté de la bête.

Peut-être même pire : cette nouvelle bête est peut-être encore plus grande, l’éléphant ne tient peut-être pas dans la pièce si l’on prend un pas de recul et que l’on regarde l’architecture « one web ». En effet nos triplets sont de plus en plus souvent distribués par des services web (doit-on alors parler de « web de services » ?) parfois eux-mêmes décrits et indexés par le web sémantique (SAWSDL). Certains de ces triplets pourront nourrir ou être produits par des règles (RIF ; doit-on alors parler de « web de règles » ?). Certains seront au contraire produits par l’interaction avec le monde physique (« web de senseurs/capteurs/détecteurs »).

Plus je me recule des recommandations individuelles, plus je regarde l’architecture globale du web et plus j’ai l’impression d’avoir à faire à une nouvelle machine virtuelle ; une « machine virtuelle mondiale » offrant un nouveau paradigme de conception, développement et déploiement applicatif au sein duquel le « graphe du web sémantique de données liées » ( ;-) ) fournit le méta modèle des structures de données.

Tout comme les applications informatiques en général héritent toutes de la séparation séculaire des données et des algorithmes, le web applicatif se dote pour son envergure mondiale de langages pour chacune de ces deux facettes ; je vais faire un nouvel aveugle en disant que l'on s'oriente peut-être vers un « web des modèles » au sens MDA O:-)

Fabien L. Gandon

@Nicolas (j'ai tout de suite deviné lequel ;-) ) Je ne suis pas d'accord, d'abord c'est VIM (ou nano ou un bête less, mon compagnon de tous les instants ces derniers jours) qui dirigera le monde :-)

@Fabien : Merci beaucoup d'avoir complété cette liste avec les points essentiels que tu abordes et d'avoir donné à voir dans ton second commentaire toutes les facettes des technologies du Web sémantique.
Si tu me permets cette synthèse, il me semble que le Web sémantique est et restera donc avant tout une activité du W3C dont les répercussions sont encore à venir et qui toucheront toutes les composantes du SI et du partage de l'information en réseau, à l'instar de ce que représente le Web de documents et le Web des applications aujourd'hui.

@Jice Web 2.0, Web 3.0 et consorts, autant de termes qui ne servent qu'à fixer un certain nombre d'avancées (en termes d'appropriation ou technologiques) autour d'un buzzword qui n'a d'autres buts que marketing.
Il est impossible de savoir comment les technologies du Web sémantique (et je me garde bien de parler de Web sémantique) vont être utilisées, comment les utilisateurs vont se les approprier. Je pense que les pionniers du Web n'avaient aucune idée de ce que serait le Web 2.0 et si quelques rares personnes ont pu dresser ce genre de prospectives, on les a certainement prises pour des fous à l'époque. Bref, je comprends bien le besoin de fixer les idées (Tim O' Reilly parle de web² pour désigner sa vision du Web de données), mais il me semble impossible d'associer le Web sémantique dans son ensemble à une étape dans la jeune histoire du Web, cela se fera certainement par différentes étapes.

@Patrick je suis en train de préparer un billet dans lequel je reviendrai précisément sur l'article de Luciano Floridi, mais il me semble important de faire d'ors et déjà une précision. Le contre-argument dans lequel je cite l'article de Luciano Floridi, à savoir « Le Web sémantique est anti-social » « Le Web sémantique ne fonctionnera pas, contrairement au Web 2.0 », ne visait pas simplement cet article. En l'occurrence, la première assertion (devrais-je dire triplet ? ;-) ) faisait référence au Web socio-sémantique auxquels répond le diaporama de Fabien Gandon.
De plus, ce paragraphe n'est pas vraiment une réponse à Luciano Floridi, car il aurait fallu pour cela que j'écrive une réponse plus détaillée et mieux argumentée. Or, ce n'était pas mon but dans ce billet. Cet article n'était donc qu'un prétexte pour introduire l'idée reçue en question et je me suis donc contenté, peut-être à tort, de répondre à la caricature dressée par Floridi par certains raccourcis nécessaires pour conserver le ton pédagogique de ce billet.

Poster un nouveau commentaire

Le contenu de ce champ ne sera pas montré publiquement.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • You may post code using <code>...</code> (generic) or <?php ... ?> (highlighted PHP) tags.

Plus d'informations sur les options de formatage

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
1 + 14 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.