Les petites cases

L'antilope sur le Web est-elle un document ?

Commentaires

Et oui, c'est ce qu'on appelle l'évolution !
Aux origines de l'humanité, on dessinait ses prouesses à la chasse sur le mur des grottes. Maintenant on se crée un "moi" en RDF (ex : http://www.lespetitescases.net/foaf_got.rdf) .
Je vous passe les papyrus, les plaquettes en granit, les tatouages sur tout le corps, etc.
Le but au final est de savoir qui l'on a en face de nous. Le document en tant que tel n'a que peu d'importance (c'est bien pour ca que les cartes d'identités, permis de conduire, passeports, etc. sont acceptés de la même manière pour nos démarches administratives, pourtant ce ne sont pas les mêmes documents).

Salut Gauthier,

Si je reprends le cas de la carte d'identité, ou plutôt du passeport. Il m'arrive de passer beaucoup de frontières depuis quelques années ;-). L'important est pour le douanier de pouvoir constater que les éléments inscrits sur le passeport, mais aujourd'hui aussi codés sur ce même passeport pour pouvoir être lu par la machine, font de moi une personne acceptable selon les critères du pays dans lequel je veux entrer.

Le passeport pourrait théoriquement être illisible par un humain. Les éléments d'identité pourraient en théorie renvoyer à ma personne comme identité abstraite à partir juste d'une identification initiale, comme l'iris de l'oeil ou encore l'empreinte digitale. Alors, comme dirait Olivier en paraphrasant S. Briet et son antilope, l'homme serait un document comme un autre.

Socialement cela n'est pas envisageable. Je dois pouvoir lire personnellement les données inscrites sur mon passeport et sans l'intermédiaire d'une machine pour vérifier leur véracité, je dois aussi pouvoir détacher ces données de ma personne physique, sinon le risque d'arbitraire devient trop grand. Je dirais pour être plus réaliste en ces périodes de contrôle tous azimuths, je dois avoir l'illusion de tout cela. En réalité le passeport renvoie à bien plus de données que celles inscrites sur le papier et il existe en démocratie une tension perpétuelle entre celles à quoi le citoyen a accès et celles qui lui sont cachées.

Inversement, le douanier, une fois le passeport scanné par la machine, lira sur son écran une page qui est aussi un document, celui-ci très éphémère, qui lui indiquera si je suis conforme ou non. Mais notre douanier ne pourra pas interpréter ce document, s'il ne correspond pas à un protocole (mis en page, contenu) dont il est familier. Le caractère éphémère du document en question est donc tout relatif. Ce qui est éphémère ce sont les données particulières, relatives à ma personne, la structure formelle et sémantique est, elle, stable.

Mon allusion à S. Briet ne renvoyait pas à l'antilope mais à son idée qu'un document est une preuve qui ne peut s'interpréter que dans un système sémantique organisé.

Pour dire les choses autrement, les données ne font pas que renvoyer à des entités abstraites. Elle s'inscrivent dans un système sémantique qui d'une part a une matérialité et d'autre part a une structure socio-linguistique et pas simplement logique. C'est cela qui justifie de prendre très au sérieux la notion de document et je ne suis pas sûr que nos amis du Web sémantique en aient vraiment conscience.

Encore une fois, je pense ici en écrivant et suis ouvert à toute critique sur un domaine qui n'est pas exactement ma spécialité.

Il me semble que vous avez déplacé le débat. Mon propos se "limitait" à une analyse (froide, peut-être) tant d'un point de vue informationel que technique de l'évolution de la mise à disposition des données structurées sur le Web (et la complexité d'y parvenir si on ne dépasse pas les modèles documentaires traditionnels) et, non, au bien fondé et aux implications sociales de l'utilisation de ces technologies. Pour le coup, c'est loin d'être ma spécialité. De plus, je persiste à penser que la notion physique a son importance dans la définition de document, alors qu'il me semble que vous la concevez uniquement par rapport à un environnement sémantique.

Même si nous différons sur la définition à donner au document, il me semble déceler dans vos propos une interprétation erronée des buts poursuivis par les technologies du Web sémantique. Comme je le soulignais dans un commentaire récent sur votre blog, la dimension "sémantique" du Web sémantique n'est pas à appréhender par le biais de la linguistique.
Les technologies du Web sémantique n'ont pas vocation à rendre le sens d'un texte compréhensible à une machine par sa description formelle et donc forcément biaisé, le temps de l'intelligence artificielle n'est (heureusement ?) pas encore arrivé, ni même à remplacer le Web de documents tel que nous le connaissons aujourd'hui. La proposition initiale de Tim Berners-Lee, et qui est le but poursuivi, aujourd'hui, par le Web de données ou ce qu'on appelle le linked data, visait à trouver les moyens de mettre à disposition sur le Web (en profitant pleinement de son architecture) l'ensemble des données structurées enfouies au fin fond des bases de données relationnelles à l'image de ce qu'il était possible de faire grâce à HTML avec les documents et, ainsi, de donner une autre dimension au Web en le reliant aux objets et concepts du monde réel. C'est le sens de ce schéma de 1994. Il n'a jamais été question de proposer une ontologie universelle du monde, d'en proposer une modélisation qui, à coup sûr, réduirait notre vision du monde, cela est impossible et va à l'encontre même des buts poursuivis par les pionniers du Web.

Les tentatives dans le domaine de la mise à disposition des bases de données relationnelles ont abouti, jusqu'à maintenant, à la constitution de ce qu'on appelle un Web invisible. Or, si les web services (qu'on peut assimiler à des API) ont permis de lever un voile sur ces données, cela est très limité, car les Web services sont très contrôlés et sont orientés dans un sens très précis, bien souvent celui qui va dans l'intérêt de celui qui contrôle la donnée (tout le modèle économique de Google est basé sur le contrôle des données et leur mise à disposition par des Web services contrôlés afin de créer un écosystème captif). Pour mieux comprendre en quoi les Web services sont limités et les avantages des technologies du Web sémantique, je vous renvoie aux billets de Christian Fauré et d'Ed Summers.

Enfin, je pense que les chercheurs dans le domaine du Web sémantique sont très conscients des problèmes sociaux qui peuvent se poser. Ce point n'étant pas ma spécialité, je me contenterai de donner quelques exemples : l'initiative Web science est dirigée par un collège de cinq chercheurs qui sont tous de près ou de loin impliqué dans les recherches sur le Web sémantique, les recherches en cours sur la notion de "confiance" (la brique trust du layer cake) ou encore les travaux autour de POWDER dont les buts sont très bien décrits dans ce diaporama de Fabien Gandon (d'ailleurs, Fabien, si tu passes par là, n'hésite pas à nous faire profiter de tes lumières et de ton avis sur ces questions).

Merci de venir voir mon commentaire chez moi : http://www.figoblog.org/node/1958 ;-)

Poster un nouveau commentaire

Le contenu de ce champ ne sera pas montré publiquement.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • You may post code using <code>...</code> (generic) or <?php ... ?> (highlighted PHP) tags.

Plus d'informations sur les options de formatage

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
13 + 2 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.