Les petites cases

L'ontologie est-elle vraiment surfaite ?

Lorsque j'avais vu passer le billet d'Hubert sur Internet actu intitulé « L'ontologie est surfaite », je m'étais promis de regarder en profondeur voire d'écrire un billet sur cet article de Clay Shirky traduit par Christophe Ducamp. Il était donc resté sélectionné dans mon agrégateur depuis un mois, c'est à dire le temps de trouver un moment pour le lire et y réfléchir.

Je dois dire qu'au-delà de ce titre provocateur il donne matière à réflexion ou plutôt offre une bonne synthèse des différentes questions que l'on se pose à droite à gauche sur la folksonomie. En effet, au-delà des critiques que l'on peut adresser à cet article que je partage complètement avec celles exprimées par Alexandre Serres sur Urfist Info, les idées exprimées dans cet article m'ont rappelé les réflexions de Manue ou le billet que j'avais écrit en décembre sur l'organisation de l'information (je ne connaissais pas l'existence de cet article à l'époque) pour ne citer que deux exemples que je connais bien. D'ailleurs, nous partageons une partie de l'analyse sur les raisons qui ont poussé à organiser hiérarchiquement l'information dans le cadre du numérique et comment les tags sont en train de faire évoluer cet ancien modèle.

Mais, comme toute synthèse, cet article se permet, à mon avis, des raccourcis qui pourraient induire en erreur notre perception des possibilités et des limites des folksonomies voire même du Web sémantique tel que le définit le W3C. Tout d'abord, il explique bien le but d'un système de classification comme Dewey dans les bibliothèques, c'est à dire ranger physiquement les livres dans des étagères, mais il oublie que les bibliothécaires ont aussi inventé des systèmes d'indexation bien plus puissants dont le but n'était pas de ranger physiquement les livres mais de les classer intellectuellement, comme le système RAMEAU. D'ailleurs, les reproches qu'il fait à Dewey conviennent bien mieux à RAMEAU. En effet, son principal défaut réside dans le fait qu'il s'agit d'une indexation figée et faite a-priori. Mais, il existe une différence fondamentale entre ces deux systèmes, Dewey est une taxonomie, c'est à dire une simple catégorisation hiérarchique de l'information, tandis que RAMEAU est un thésaurus, c'est à dire qu'en plus de l'organisation hiérarchique, les termes sont reliés de façon transversale entre eux. Dans ce qu'on appelle l'ontology spectrum, c'est à dire le classement des systèmes de modélisation de l'information sur un spectre allant de la « sémantique faible » à la « sémantique forte » et à la logique modale, la taxonomie est en-dessous du thésaurus et encore plus loin de OWL, le vocabulaire RDF pour définir des ontologies et mis au point au W3C dont les possibilités sont encore plus importantes que les thésaurus1. Ainsi, l'auteur n'a visiblement pas en tête ces différences fondamentales entre les systèmes. Il qualifie donc d'ontologie une taxonomie comme Dewey ou un système de classification comme l'annuaire de yahoo qui s'apparente plus à un thésaurus. Et, il en arrive à oublier la pertinence et la puissance de ces systèmes de logique qui ont fait leur preuve dans les expériences d'intelligence artificielle. Mais, comme il le fait remarquer, définir un domaine restreint et défini est simple, mais définir le monde est une autre affaire.

Finalement, j'ai l'impression que ces différences ne l'intéressent pas, ce qui est certainement dommage pour la clarté de son propos voire l'avancée de sa réflexion. Tout le but de son article voire de son combat (l'ironie est tangible dans ses propos) est de montrer que le système de la folksonomie est bien plus pertinent pour la classification d'une grande masse d'informations que l'utilisation d'un vocabulaire définie a-priori qui pourrait faire perdre des informations et brider l'utilisateur. Je serai bien mal placé pour le contredire, me faisant le défenseur de la validation a-posteriori et son analogie avec les journalistes est assez bien vu. Pourtant, il me semble que, comme il serait erroné de rejeter la validation a-priori dans le cadre de la publication, il serait dommageable de rejeter les systèmes de classification/indexation/catégorisation a-priori ou du moins de se couper de l'expertise des professionnels comme les bibliothécaires sur ces systèmes. En effet, je suis d'accord avec lui que dans le cas de la folksonomie et du Web, la masse de données et des tags permet toujours une certaine interopérabilité. Pourtant, si on pouvait mettre en place des systèmes de classification de haut niveau figés (du moins évolutif mais existants a-priori dans les systèmes) auxquels on pourrait rattacher selon nos désirs nos différents tags, nous gagnerions en visibilité et donc dans la recherche de nos informations. De même, comme l'ont déjà exprimé Manue et Karl, il serait assez simple de mettre en place des systèmes qui permettent de regrouper les tags entre eux, peut-être même des systèmes personnels propres à chaque utilisateur. Chaque utilisateur pourrait ainsi rattacher ses propres tags avec les tags des autres utilisateurs selon un thésaurus/ontologie qui lui serait propre.

Finalement, le système de tags convient bien à notre société googlisée de l'a peu près. Ce qui importe l'utilisateur n'est pas/plus d'avoir le résultat exact recherché, mais le résultat le plus approchant de la demande initiale. Mais, pourquoi donc devrait-on se contenter de cela ? Non, l'ontologie n'est pas surfaite, elle peut participer à l'organisation de l'information au même titre que la folksonomie, les opposer serait une erreur, les associer serait un formidable défi à l'intelligence collective dont le Web permet chaque jour un peu plus l'émergence. Vous ne croyez pas ?

Quelques notes en passant

1 Si vous voulez en savoir plus sur les ontologies et OWL, vous pouvez faire un tour dans le tag qui lui est consacré sur ce blog ;-)

Web sémantique Causeries Folksonomie — 

Commentaires

« définir un domaine restreint et défini est simple, mais définir le monde est une autre affaire. » C’est exactement ce qui a sonné le glas de l’intelligence artificielle classique http://blog.empyree.org/?771-retour-sur-l-intelligence-artificielle-clas.... Deux questions de parasynonymie en passant : - quelle est la différence entre un dictionnaire de synonyme et un thésaurus ? Les Étasuniens au moins désignent par thésaurus ce que nous appellons dictionnaire des synonymes. - quelle est la différence entre la sémantique et l’ontologie ? Est-ce un abus de langage (du même type que celui qui pousse à utiliser citoyen comme adjectif dans « initative citoyenne ») que d’utiliser sémantique comme un appellatif (il ressemble davantage à un adjectif, même si des exemples comme physique, mécanique… montrent que ce n’est pas une fatalité) ? L’ontologie est-elle la science traitant des choses sémantiques ? Dans ce que je vois de ton article sur la question (ainsi que mes souvenirs de philo), ce n’est pas tout à fait la même chose, enfin me semble-t-il (http://lespetitescases.net/index379). Peut-on dire (toujours en suivant cet article) qu’ontologie est désormais polysémique ? Comme tu le sais, je ne visiterais probablement pas cette page à nouveau, en l'absence de notification automatique. Mais tu sais où me joindre ;-) Ah aussi : j’ai laissé chez Manue un commentaire qui est réduit à un pâté d’un paragraphe (ainsi que quelques suggestions d’amélioration de Lodel). Peut-être le fait que les retours chariots ne soient pas reconnu vient du fait que je suis sur Mac, qui a un retour chariot différent de Linux ou Windows. Ici, j’ai utilisé du retour chariot Unix, en espérant que ça ira mieux ainsi.