Les petites cases

Les carcans de la pensée hiérarchique et documentaire (1)

Dans un billet intitulé « Comment organiser l'information pour y naviguer efficacement », j'essayais d'analyser en quoi l'organisation hiérarchique de l'information, issue des pratiques d'organisation physique de l'information, que ce soit dans un livre-codex ou sur un système de fichiers, influençait notre pratique du Web et comment, peu à peu, l'hypertexte et certaines pratiques, alors naissantes, comme la folksonomie ou la multiplication des métadonnées pouvaient permettre de dépasser ce paradigme pour démultiplier les accès à l'information et donc son exploitation. Je vous propose de revenir sur ces questions pour comprendre en quoi il est nécessaire aujourd'hui pour appréhender au mieux les enjeux du Web de données de s'abstraire de ce paradigme pour aller vers un nouveau modèle d'organisation et de modélisation de l'information.

De l'influence des contingences physiques sur la production documentaire

Au préalable, il me semble important de revenir sur la notion de document, d'une part, et de structure hiérarchique, d'autre part, en particulier sur le rôle des contraintes physiques sur le paradigme qu'elles forment.

Un document se conçoit comme un ensemble logique fini délimité par des caractéristiques physiques :

  • un livre est un document dans la mesure où il constitue un ensemble logique intellectuellement dont les limites sont déterminées par les notions de page et de reliure ;
  • une notice bibliographique est un document dans la mesure où elle rassemble un ensemble circonscrit de données à propos d'un autre document sur une fiche physique.

Un document forme donc un tout indépendant tant d'un point de vue logique que physique, éventuellement relié à un autre document par des références, mais qui ne sont pas essentielles pour l'appréhender. La production intellectuelle est donc étroitement liée aux contraintes physiques du support au point qu'ils se confondent dans la notion de document.

Ce constat est encore plus prégnant pour la structuration hiérarchique, car celle-ci est un avatar de la prise en compte des contraintes physiques dans la mise à disposition d'une construction intellectuelle de nos idées. Les supports physiques imposent une représentation linéaire du document. Peu à peu, pour aider le lecteur à l'appréhension d'un texte mais aussi le producteur à l'écrire, les hommes ont structuré leurs documents textuels par des divisions explicites ou implicites.

Au Moyen Âge, par exemple, les clercs de chancellerie s'appuyaient sur des formulaires qui contenaient le canevas des textes juridiques, entre autres, les prêtres quant à eux disposaient d' exempla qui leur permettaient de construire leur prêche tant sur le fond que sur la forme. Les chapitres, les paragraphes et les phrases sont les divisions hiérarchiques les plus simples que nous utilisons tous les jours (ce billet en est d'ailleurs la preuve !). Or, toutes ces divisions forment une structure hiérarchique pour une raison simple, celle-ci est le seul mode possible d'organisation de l'information dans un espace linéaire.

Différents systèmes ont été mis au point pour s'abstraire de la linéarité due aux contingences physiques, les index, par exemple, permettent d'appréhender de manière transverse un document. Mais, ces différentes tentatives se limitent à la tabularité du texte (ou « paratexte » pour reprendre les termes de Gérard Genette) et n'impactent pas le texte en lui-même. La structure hiérarchique de l'information est donc au cœur même de l'ensemble de notre production documentaire, car elle est intrinsèque à notre manière de concevoir la fixation de nos idées.

Le Web s'abstrait des contingences physiques

Le Web est basé sur une architecture décentralisée ce qui a au moins deux conséquences :

  • chaque nœud du Web possède un identifiant qui permet de l'identifier et de le localiser au sein du réseau, l'URL, dont le principe sera généralisé avec le système des URI ;
  • à la différence des systèmes hypertextuels qui existaient avant le Web comme HyperCard, il est possible sur le Web de lier une ressource à une autre qui n'existe plus, pas ou pas encore ;

Ce dernier point est fondamental car il va à l'encontre même de la notion d'ensemble fini à la base du paradigme documentaire, sans compter qu'il n'existe pas d'impératifs physiques liés à une page ou une reliure. Ainsi, la notion même de document n'est pas transposable dans le Web. Il n'en est d'ailleurs pas question dans les recommandations du W3C. Celles-ci font référence à une « ressource », notion assez floue défini comme toute entité possédant une URI. C'est d'autant plus vrai que le protocole HTTP permet d'associer à une ressource différentes représentations.

Par ailleurs, le choix de baser le Web sur le principe de l'hypertexte permet de dépasser la structure hiérarchique de l'information pour aller vers un une modélisation sous forme de graphes.

Mais, pour être tout à fait complet, il serait abusif d'affirmer que la notion de document et la structuration hiérarchique n'existent pas sur le Web. La représentation en HTML d'une ressource, pour faire simple une page HTML ou une page Web, est organisée de manière hiérarchique. La raison en est simple, HTML est basé sur SGML, l'ancêtre du XML, qui propose une modélisation hiérarchique de l'information. Il n'est pas aberrant de retrouver ici le paradigme traditionnel dans la mesure où une page Web constitue une représentation d'une information pour les humains. Néanmoins, une page Web ne se conçoit que dans un réseau hypertextuel, il ne faut donc pas la limiter à cette notion de document. De plus, continuer à penser la mise à disposition de l'information sur le Web selon le paradigme documentaire et hiérarchique constituerait une erreur, car cela enfermerait le Web à une suite de pages Web très faiblement reliées et irait à l'encontre même des principes qui ont été à la base de son édification.

Lire la suite

Structuration Web sémantique XML Système d'information Causeries Histoire — 

Commentaires

Salut Gauthier,

Je ne suis pas sûr d'être d'accord avec tes définitions. Je suis même sûr de n'être pas d'accord, en particulier sur celle de document. Prenons le document le plus basique : la carte d'identité. Ce qui la fait document n'est pas que c'est un ensemble logique fini, mais qu'elle comprend un ensemble de données qui définissent son référent et qui ne sont compréhensible que parce qu'elles font référence à divers ensembles logiques qui existent en dehors d'elle. En réalité une carte d'identité n'est interprétable que par son contexte et ceci est valable pour tous les documents depuis la nuit des temps, ou plutôt depuis les débuts de l'humanité. Il est utile de relire S. Briet sur ces questions.

Inversement un discours pour se construire s'appuie sur une hiérarchie, mais pas uniquement sur une logique strictement formelle, sur une logique linguistique, et le sens n'est produit que par des discours.

Que le W3C ne fasse pas référence à la notion de document ne signifie pas qu'il ait raison. On peut aussi analyser cela comme un défaut, une lacune, une incapacité à penser lucidement le sémantique. Personnellement je n'ai pas de point de vue arrêté sur cette question, qui dépasse mes compétences, mais beaucoup de scepticisme à la lecture des documents ;-) sur le Web des données.

Un commentaire n'était pas suffisant pour vous répondre sérieusement, vous trouverez donc ma réponse dans ce billet. J'espère que vous ne me porterez pas ombrage du clin d'œil humoristique pour son titre ;-)

Que d'affirmations massives... J'aimerais amener une précision sur une supposée « nature hiérarchique » de SGML/XML/HTML :

Contrairement à une croyance répandue, aucun modèle documentaire particulier n'est normalisé par SGML/XML. Les content models sont uniquement des formulations de règles syntaxiques visant à identifier sans ambiguïté les characters et le markup, et les endroits où ils sont permis dans un document. Le système de réécriture n'impose aucune signification au balisage. Le véritable modèle d'organisation est le modèle en entités, qui est a-hiérarchique.

Le multidimensional markup et l'approche en graphes ont été au cœur du programme SGML dès le départ, avec des fonctionnalités SGML comme SUBDOC et CONCUR, puis les « formes architecturales » de HyTime. Avec XML, les modèles stand-off d'annotation de corpus du type TEI/XCES, projet GeM, etc., permettent de rendre compte de la superposition non contiguë d'autant de structures que le nécessite l'analyse d'un même « texte ». Il est alors possible d'articuler les découpages linguistiques (phrases, clauses, morphèmes), les conteneurs éditoriaux (chapitres, section, paragraphes), les organisations fonctionnelles (clusters visuo-spatiaux), les parcours rhétoriques (noyau/satellites), etc., sans être contraint de privilégier une vue au détriment d'une ou plusieurs autres.

Je suis entièrement d'accord avec vous et, il me semble l'avoir déjà écrit avec beaucoup moins d'érudition que vous à plusieurs reprises sur ce blog : Retour sur un des articles de Pédauque, Les réalités dans l'encodage XML, Sémantique et XHTML.

Loin de moi donc l'idée de remettre en cause le principe et l'utilisation de XML pour encoder des textes, c'est sa vocation et il le fait très bien. Néanmoins, je voudrais revenir sur la dimension hiérarchique, car la lecture de votre commentaire m'amène à penser que je me suis mal exprimé.

Il est effectivement possible de structurer une information sous forme de graphes avec XML. Ainsi, en XML, on peut faire référence dans une portion d'information encodé à une autre portion d'information qui ne se trouve pas au même niveau de l'arbre grâce à un système d'identifiant-de référence à l'identifiant (ID-IDREF). Ainsi, en TEI, vous pouvez faire référence à un terme dans un index, une référence bibliographique au sein du texte... Dans le schéma de métadonnées METS, ce système est poussé à son paroxysme puisqu'il constitue le principe même du schéma, pour aller très vite, on relie différentes sections de métadonnées qui sont toutes au même niveau de l'arbre à une (ou plusieurs) division de la carte de structure de l'objet complexe décrit.

Mais, ce système pose plusieurs problèmes. Tout d'abord, le système d'identifiants et de références est limité au fichier XML encodé, il est très complexe de faire référence à une portion d'information depuis une portion d'un autre fichier XML (les propositions de la TEI en la matière ou Xpointer, recommandation du W3C, sont d'une complexité redoutable et je ne sais même pas si quelqu'un les utilise vraiment...). Par ailleurs, comme l'explique André Davignon dans un commentaire au billet suivant, il est nécessaire de différencier la modélisation de l'information de sa représentation syntaxique. S'il est possible de représenter des relations transverses au sein d'un fichier XML, l'ensemble du fichier XML constitue un arbre tant du point de vue syntaxique que du modèle sous-jacent d'exploitation. Or, c'est très consommateur en termes de ressources machines d'exploiter des liens transverses à différents nœuds de l'arbre XML, entre autres, car il est nécessaire de repasser systématiquement par la racine de l'arbre pour naviguer entre des nœuds qui ne sont pas au même niveau (et je m'arrêterai là, n'étant pas spécialiste de cette partie).

Pour conclure, XML reste le modèle à privilégier pour encoder des textes, mais il me semble que, tant du point de vue du modèle que des problématiques techniques, il est nécessaire de passer à des technologies plus proches du modèle de graphes pour encoder les métadonnées qui ont un statut différent du texte, mais qui sont encore trop conçus selon une approche documentaire et encodés selon le modèle XML, c'est-à-dire un modèle d'arbres.

Je te rejoints sur plusieurs points que je pressens également. Cette année, j'ai donné des cours en Master 2 à Lyon 3 sur la description des documents électronique en tentant de présenter ces diverses tensions.
J'ai donc mis d'emblée en cours d'introduction en débat la notion de document numérique et opéré un choix de diversifier les différents langages en commençant par les métadonnées mais en montrant qu'on ne faisait pas qu'indexer et décrire des documents. J'ai donc abordé quelque peu le rdf et le web "sémantique" en jouant surtout sur l'ouverture d'esprit en la matière et en incitant à tester.

Pour la partie théorique, il faudrait vraiment réaliser un article sur les forces et faiblesses de l'héritage documentaire et mettre en avant pour pouvoir continuer d'avancer et de progresser la culture technique à l'œuvre dans la documentation face à la culture littéraire qui constitue un obstacle selon moi.
Au final ta position renverse la position de document, qui est à la base figé en documentation pour opérer une description : il est un peu un socle. Dans la tienne, il devient plutôt un but. Une téléologie.
Un article dans le BBF ou l'Adbs serait opportun car j'ai le sentiment, que beaucoup de professionnels ne peuvent plus suivre du fait d'une culture essentiellement littéraire au niveau formation.

Pour conclure, la documentation doit à nouveau bouger : à la fois dans son versant pédagogique et de formation (c'est le but de ma thèse) mais également en ce qui concerne ses bases scientifiques et techniques.
Par conséquent la notion de document ne disparait pas pour autant mais sa position tend à se différer.
En fait, on passe d'un document stable à un document métastable comme dans la philosophie technique de Simondon.

Intéressant / ambitieux. Le lien entre Hiérarchie et Linéarité n'est pas évident, et j'ai l'impression qu'il y a dans l'impensé de ton texte l'idée que "hiérarchie DONC linéarité". Je crois qu'il y là deux choses différentes, on pourrait même dire que par certains aspects que la hiérarchie va à l'encontre de la linéarité. Par ailleurs, il aurait été intéressant de thématiser plus le "lecteur", même si tu l'évoques. Le livre est conçu pour un lecteur *humain* (qui peut prendre des libertés dans le parcours et la consultation du livre), alors qu'avec les formats numériques et le web, le lecteur est d'abord un *reader* non humain (Browser ou tout autre logiciel). Voir à ce sujet le texte de A.Giffard sur les lectures industrielles dans "Pour en finir avec la Mécroissance". Quant au principe du web qui permet de faire des liens vers des ressources qui n'existent pas, je suis tout à fait d'accord avec l'importance de cette notion :-)

Je commence par la fin si tu le permets et je me dois effectivement de rendre à César ce qui est à César : tu es le premier à m'avoir orienté vers ce principe et m'avoir démontré son importance (d'où les remerciements, ainsi que pour toutes les discussions et les idées, à la fin du second billet ;-) ), mais j'avoue que j'ai mis du temps à comprendre réellement toutes les implications de cette notion et que c'est en réfléchissant à ce billet qu'elles me sont apparues totalement.

C'est à dessein que je n'ai pas plus évoqué le lecteur, ma problématique (très mal exposée, je le constate au fil de mes réponses aux commentaires) s'orientait plutôt du côté des machines, c'est-à-dire d'étudier en quoi les modèles documentaires traditionnels doivent être dépassés tant d'un point de vue informationnelle que technique dans certain cas pour permettre une meilleure exploitation des données. Or, dans ce cadre, je te confirme que modélisation hiérarchique de l'information (pour faire vite XML) est bien égal à linéarité. Je m'explique, pour une machine, un fichier XML est assimilable à un flux (c'est d'ailleurs bien souvent ainsi qu'on le dénomme). Dans le cas où nous tentons dans le cadre de la fixation de nos idées (en y parvenant artificiellement à mon avis avec les modèles traditionnels) de nous abstraire de la linéarité voire de la hiérarchie, cela pose bien souvent des problèmes lors de l'exploitation par les machines car, elles exploitent un flux linéaire représenté sous la forme d'un arbre.

Une autre forme de modélisation et de représentation s'avère parfois plus performante (tant d'un point de vue technique qu'informationnelle), mais les habitudes de pensée nous empêchent bien souvent de penser les choses différemment, il me semble que c'est largement le cas dans le cadre de la mise à disposition des métadonnées, et, plus généralement, des données structurées (je ne parle pas des textes...).

Ces problèmes ont une origine simple : chaque modèle, chaque technologie, chaque protocole ont des avantages et des limites, car ils répondaient à l'origine à des besoins précis qu'il est nécessaire de comprendre et de s'approprier, même au prix d'une remise en cause de schéma de pensée existant. En ce sens, je ne peux que souscrire à la position d'Olivier, lorsqu'il en appelle à plus de culture technique dans la documentation que j'élargirai aux sciences de l'information.

Coucou, la pensée hiérachique est souvent représentée sous forme d'arbre or un arbre est un graphe non cyclique certes, mais un graphe. Attention au vocabulaire. Les plus célèbres algorithmes de parcours des graphes sont bien documentés dans Art of Computer Programming, vol. 1 Fundamental Algorithms, chapitre 2 : Information structure, de Knuth, un ouvrage de 1969, comme quoi c'est pas tout neuf (je conseille de ne pas attaquer le livre par le chapitre deux, cela risque d'être violent :)).

Quant à penser le document écrit sous forme hiérarchique, c'est assez souvent une erreure, un document est le plus souvent un flux, ainsi s'il y a des marqueurs comme des titres pour revenir à une partie précise du discours, il y a de nombreux documents dont la lecture séquentielle est le seul moyen de comprendre pleinement l'idée. Les tables des matières, index, ne permettent finallement que d'accéder à une information atomique qui peut être très utile, mais qui n'est pas non plus bien compliquée. Ensuite, Il m'est arrivé fréquemment d'être rebuté par des documents pensés et écrits d'une manière strictement hiérarchique. Un exemple, la documentation au format TeXinfo du GNU est ce que j'ai pu lire de pire. J'ai tiré bien plus de connaissances de la documentation originale d'UNIX conçue comme une série classique d'articles < http://cm.bell-labs.com/7thEdMan/bswv7.html >. Notons aussi la baisse d'apprentissage quand le document ne se résume plus qu'à une liste hiérarchique. Prenons un exemple avec une star, Rob Pike. En 1983 il fait avec Brian Kernighan une conférence sur la conception des programmes dans l'environnement UNIX. Il en reste un fantastique article qui apporte des idées qui enrichissent au-delà de la prog en C sous UNIX < http://gaul.org/files/cat_-v_considered_harmful.html >. En 2000 il fait une conférence sur la baisse de recherche dans le secteur des système d'exploitation où il fustige l'inertie engendrée par UNIX. Le sujet a l'air très intéressant, mais il n'en reste que le squelette hiérarchique d'un document powerpoint (un de plus) < http://doc.cat-v.org/bell_labs/utah2000/ >. On ne peut pas en tirer grand chose (même quand comme moi on trouve l'inertie d'UNIX regrettable), la trame d'un discours n'est pas un discours (et si votre discours se comprend en une trame, c'est qu'il n'est pas très riche). Bref, il y a plus que la hiérarchie et la lecture en flux est un des rares moyens pour goûter le fruit interdit en ce moment.

Je n'ai réagis que sur l'aspect hiérarchique des documents qui m'énerve aussi mais pour d'autres raisons :).

Bonjour,

Pardonnez moi de faire irruption sur votre site alors que je ne vous ai pas été présenté. Parmi les commentaires qui ont été laissés sur cette page et la suivante, je suis connu d'André Davignon ou de Nicolas Legrand (avec qui je travaille à l'école des chartes). Je trouve vos idées stimulantes, sans pouvoir être complètement convaincu, raison pour laquelle je me permet de laisser cette trace.

"Les carcans de la pensée hiérarchique et documentaire"

Puisque vous avouez que la hiérarchie conduit aussi votre pensée, ce ne sera pas vous trahir que de commencer par lire votre titre. Vu de loin, le document n'emprisonne probablement pas grand monde. Qui aime un auteur veut tout en lire, et peu importe qu'il soit sur papier journal ou papier bible, en extraits ou en œuvre complète. La bibliophilie est le fétichisme qu'il reste d'une passion morte, ou inassouvie, car au fond le seul document important, c'est celui qu'il faut écrire, une forme qui loin d'enfermer, hante et stimule. La distribution des œuvres selon les reliures et les ISBN est un métier, indispensable à la culture, et qui aura payé beaucoup de savants et d'écrivains, mais ce qui importe, c'est l'œuvre, la création. Je ne suis pas certain que la pensée documentaire ait encore beaucoup de penseurs, cela me semblait plutôt un commerce, l'autre membre de votre assertion me semble plus fécond : la pensée hiérarchique est-elle un carcan ?

Que votre propos soit habillé d'acronymes modernistes ne cache pas la vieillesse millénaire de votre question, qui est aussi bien logique, que morale, et politique. Chercher ces causalités peut sembler des détours inutiles, mais ne risque-t-on pas d'en être influencé à notre insu, si l'on n'y jette pas un œil ? Je vous propose de partir de ce postulat. La pensée spontanée est informe, comme l'association d'idées du rêve. Dès lors, l'ordre et la hiérarchie des pensées sont les dures conquêtes du travail de la réflexion, qui, avouons le, n'entrave pas grand monde. Au contraire, la hiérarchisation des pensées libère, car en triant l'accessoire de l'essentiel, on découvre les principes qui découlent de notre nature. L'ordre dans nos idées donne de la puissance à notre propos et à notre action. Ceci étant, cette hiérarchie n'est libératrice que lorsqu'elle est librement conçue et consentie, comme l'auteur dans son livre, ou l'élève dans un cours. Le problème commence avec les hiérarchies collectives.

Le web est en effet une expérience politique instructive. Yahoo a perdu contre Google. Il n'a plus son annuaire hiérarchique en page d'accueil, ouvrant la boîte de recherche plein texte qui a fait le succès de son concurrent. Ces annuaires de sites existent encore, mais peu consultés, toujours en retard d'un lien, jamais fiables. Mieux vaut la recherche plein texte pour attraper une page tête de réseau, à partir de laquelle suivre son chemin sur la toile. Le moyen-âge dont vous parlez souvent n'aurait certainement pas apprécié cette anarchie. Il aurait peut-être articulé l'Internet comme le « grand miroir » (Speculum Maius, Vincent de Beauvais), en trois parties : la terre, ou Speculum Naturale, l'homme et ses arts (Speculum Doctrinale), et enfin le ciel de la providence, le Speculum Historiale qui va de la création jusqu'au siècle du livre (pas de prophéties). La hiérarchie explicite l'individu, mais lorsqu'elle s'impose à une société, cette clarté devient contradictoire avec le principe au fondement de notre droit, car elle ferait nécessairement primer une idée sur un autre, et donc par conséquent, la personne, ou le groupe, qui s'en réclame. C'est évidemment facile de le dire après, mais même un ordre aussi mou qu'un plan de magazine ou de journal télé, cette énumération de sujets en ordre alphabétique (Arts, Business, Computers, Games...), cela rangeait déjà bien trop dans des petites cases.

Individuelle, la hiérarchie libère la pensée, c'est imposée collectivement que c'est un carcan. Cette distinction me semble aider à s'y retrouver dans les questions que vous abordez.

Ainsi, vous semblez considérer que c'est la matérialité qui est cause de la pensée hiérarchique. Il me semble au contraire que c'est le désir d'ordre qui a créé le livre, et l'histoire des textes classiques montre bien l'insatisfaction d'avoir Homère ou la Bible en diverses versions désordonnées. Je prendrais un exemple moins connu, mais où la matérialité est encore plus instructive, le Shī Jīng 詩經, ou « Classique des vers ». La culture chinoise a aussi ses livres sacrés, en tous cas fondateurs, parmi lesquels, un recueil de chants antiques. Les dates de création se perdent dans la tradition orale, on suppose que le texte commence à s'écrire vers -500. Les caractères sont alors posés sur des baquettes de bambous, à une par vers, si bien que l'ordre du poème est très aléatoire. La nature de la langue mène à ce que les baguettes puissent être mélangées, et le texte garder un sens. Confucius, déjà, s'en plaignait, il est crédité de la première édition du Shī Jīng, c'est à dire d'avoir fixé le texte des poèmes, leur ordre, et les titres des sections, arrêtant la compilation pour l'éternité au nombre si peu symbolique de 305. Cette même culture a un autre classique aussi important, le yì jīng 易經 , ou « Classique des mutations ». Ce livre de divination a été fort vanté par l'utopie californienne car l'ordre des pages est donné par le hasard (ou le destin ?). Dans notre culture aussi, qu'est-ce qui nous empêchait de faire des livres à feuilles volantes ? L'utopie californienne n'a pas manqué de retrouver nos livres aléatoires, les jeux de cartes, notamment le tarot divinatoire. Autrement dit, la matérialité du document n'est pas cause mais effet du travail intellectuel, de mettre en ordre.

Au début de l'hyperlien, on a vu fleurir toutes sortes d'expériences littéraires forcément révolutionnaires, de récits à chemins multiples. Au mieux, cela valait ces « livres dont vous êtes le héros », aucun écrivain n'en est sorti. Autrement dit, je ne pense pas que la virtualité hypertexte va dépasser grand chose, elle est surtout en train de déshabituer la jeunesse de la lutte avec un plan. Il y a, pour la plupart d'entre nous autour de cette page, un véritable apport de la navigation sur le web, parce que nous avons eu la tête construite avec de bonnes écoles ou de bons livres. Le butinage nous donne matière à penser, parce que nous avons déjà une pensée organisée. Mais pour la jeunesse, l'abandon du livre, que ce soit pour le zapping il y a vingt ans, ou le clic aujourd'hui, ce sont des générations qui non seulement ne pratiquent pas, mais même, ne respectent plus le livre. La généralisation de votre propos semble mener à la ruine de votre commerce, de nos emplois.

C'est ainsi qu'un instrument de recherche archivistique fortement hiérarchisé ne résulte pas d'une quelconque prison mentale. La feuille, dans la chemise, dans le dossier, dans le carton, sur l'étagère, dans l'armoire, de la sallle... cet emboîtement n'est pas la cause mais l'effet d'une mise en ordre qui permet de rapidement parcourir la totalité du fonds pour arriver à ce que l'on cherche. Une autre structure de données, par exemple un graphe moins contraint, augmente de manière aléatoire le nombre de nœuds à parcourir pour accéder à un élément identifié. La virtualité économise la manipulation des masses, mais ne pourra pas accélérer la vitesse de la pensée du chercheur qui parcoure le graphe.

Cette réalité est d'ailleurs aussi vraie pour les machines, quand bien même les serveurs augmentent en puissance. En effet, le temps de parcours d'un graphe RDF à travers tout le réseau ne sera pas négligeable. Si un jour cela prenait, car on en parle maintenant depuis 10 ans, il faudra nécessairement établir des hub, en tous cas des nœuds privilégiés, hiérarchiquement supérieurs à d'autres, afin d'optimiser les temps de parcours. Comme toute utopie, le réseau est une posture flatteuse, tant que l'on ne doit pas concrétiser. Il faut éviter la mauvaise foi du révolutionnaire qui accuse la faiblesse humaine pour ses échecs dans l'histoire, alors que c'est à une théorie politique de prendre en compte cette faiblesse. Ainsi, les problèmes techniques seront consubstantiels au modèle formel du réseau. S'il y en a si peu d'implémentation, ce n'est pas parce que les gens sont bêtes, c'est parce que c'est peu efficace.

Ceci étant, et c'est en cela que je trouve votre billet stimulant, la hiérarchie est le chemin le plus court pour trouver ce que l'on cherche, mais elle n'est pas la meilleure pour trouver ce que l'on ne cherche pas. Or, j'ai affiché dès le départ, le principe qui me gouverne : la création, artistique d'abord, mais aussi dans la recherche. Si le plan est le but de l'exposition, c'est dans l'association libre de l'inconscient que s'invente des idées. A cette fin, un réseau de corrélats est une valeur ajoutée extraordinaire à un bon plan hiérarchique. Cela peut éviter de gaspiller des énergies à enraciner l'arbre jusque dans le moindre détail, il ne faut pas avoir honte des étiquettes "divers", des tas un peu mal rangés. Le temps n'est pas infini, et le perfectionnisme de l'ordre peut devenir une pulsion de pouvoir maniaque et étriqué, bien loin des vertus libératrices de grands plans d'ensemble. Votre insistance à promouvoir le réseau est certainement utile, pourvu qu'elle ne dissuade pas pour autant des arbres.

Honte à moi je n'avais toujours pas lu ce billet!

Got a écrit un texte. Ce texte parle d'un problème. Ce problème n'est pas simple à appréhender.
Michael Wesch a fait une vidéo.
Cette vidéo parle d'un problème.

Le texte de Got et la vidéo de Michael Wesch parle du même problème.

Je te laisse le soin d'encoder tout ça en RDF
Ah j'oubliais

Michael Wesch est Formidable
Got est formidable
Toutes les personnes travaillant sur des systèmes d'information documentaires devrait lire ce texte et regarder cette vidéo.

Merci Aurélien, je rougis devant cette comparaison.

Pour info, j'avais analysé/répondu/chroniqué la vidéo de Welsh au moment de sa sortie : http://www.lespetitescases.net/information-en-revolution