Les petites cases

Le SI en bibliothèque : exemple des limites de la logique applicative

Le monde des bibliothèques (et plus généralement de la documentation) a très tôt compris l'intérêt des systèmes informatiques pour gérer les fonds documentaires. De façon que l'on pourrait juger aujourd'hui, paradoxale, alors que les bibliothécaires ont pris soin de définir des règles très précises de structuration des notices avec les formats MARC et dérivés (MARC 21, Unimarc, Intermarc...), les systèmes d'information déployés ont suivi une logique applicative. Ainsi, est né le SIGB, système intégré de gestion de bibliothèques rassemblant tous les outils nécessaires pour remplir les missions des bibliothèques :

  • gestion bibliographique
  • gestion des périodiques
  • gestion de la circulation des documents
  • gestion des emprunteurs
  • gestion de la recherche documentaire
  • gestion des acquisitions
  • gestion des collections

Alors que les SIGB répondaient parfaitement aux besoins relatifs à la gestion des ressources traditionnelles sur support imprimé, ces dernières années ont vu des évolutions très importantes qui ont profondément changé l'environnement des bibliothèques et leur mission :

  • L'introduction de la documentation électronique sur cédéroms qui se retrouve en dehors du SIGB. Même si ce type de support équivalait dans un certain sens aux ouvrages, il ne se suffit pas à eux-mêmes et oblige une installation sur les postes de la bibliothèques.
  • La création et la publication par la bibliothèque d'information, essentiellement sous forme numérique via son site Web : numérisation, bibliographies, revue de presses, dossiers de veille dont la création et la consultation n'a pas été prévue par les SIGB, se rapprochant plus des logiciels de GED ;
  • La mise à disponibilité des OPAC en ligne a fait évoluer les usages. Ce ne sont plus simplement des outils de recherche (au sens search) pour confirmer la présence et trouver la localisation d'un ouvrage dans la bibliothèque, mais des outils d'« extraction de l'information » (au sens retrieval).
  • La nécessaire prise en compte des ressources, gratuites ou non, disponibles sur les réseaux, en particulier le Web, et leur intégration dans le fonds de la bibliothèque.
  • Le développement du Web et des moteurs de recherche a provoqué des changements profonds dans la recherche et l'accès à l'information et, par conséquence, dans les usages, l'implication et les exigences des utilisateurs qui ne se contentent plus de la recherche sur les métadonnées.

Or, le SIGB constitue un système d'information monolithique qui permet difficilement, suivant en cela la logique applicative, l'intégration de nouvelles briques qui n'ont pas été prévues à la base et qu'il est difficile de faire évoluer. Mais, comme il correspond aux coeurs de métiers des bibliothèques et des centres de documentation, les professionnels de la documentation y restent attachés, ce qu'ont bien compris les éditeurs dont la stratégie est d'enfermer les établissements dans la logique d'une application, rendant la migration difficile. Mais plusieurs questions se posent : l'activité traditionnelle restera-t-elle encore longtemps le coeur de métier de la documentation ? Comment intégrer ces nouveaux types de fonds pour répondre aux besoins des utilisateurs de retrouver, extraire l'information la plus pertinente dans un délai restreint ? Comment faire évoluer l'offre logicielle en fonction des usages évoluant de plus en plus vite, avec l'appropriation du Web par les utilisateurs, en particulier comment mettre les utilisateurs au centre du système, à l'image des applications du Web 2.0 ?

De fait, alors que le SIGB et le catalogue constituaient la seule information numérique à gérer par la bibliothèque, elle n'en constitue aujourd'hui qu'une partie. L'enjeu en terme de recherche documentaire est double :

  • proposer un ou plusieurs outils afin de permettre au lecteur une recherche dans toutes ces sources d'information numérique ;
  • faire face aux mastodontes de la recherche sur le Web : Google et consorts. Dans un contexte où tout est accessible en ligne et interrogeable via Google (qui indexe aussi des catalogues de bibliothèques dont Worldcat), quelle est la spécificité du travail mené par les bibliothécaires ? Comment mettre en valeur toute cette masse de notices structurées que constitue le catalogue ?

Le monde de la documentation s'est alors tourné et se tourne encore pour une partie, vers la solution que constitue la recherche fédérée1. Un moteur de recherche indexe les différents types de données numériques produits, conservés et mis à disposition par la bibliothèque et y donne accès par une interface unique à la Google. Ce système présente plusieurs avantages pour les bibliothèques. Il permet de conserver les différentes briques applicatives déjà mises en place, le moteur ne constituant qu'une sur-couche permettant une recherche transversale dans l'ensemble de la documentation numérique. L'essentiel de la problématique est alors de constituer le moteur de recherche et de trouver les moyens d'indexer les différentes informations.

La recherche fédérée répond parfaitement à un contexte où il n'est pas possible d'influer sur les différentes briques applicatives pour des raisons diverses : main mise d'un autre service sur les aspects informatiques, investissement pour changer le système, volonté de ne pas déstabiliser l'ensemble du système d'informations, impossibilité des migrations.

Pour autant, cette solution pose bien des problèmes. Tout d'abord, l'hétérogénéité des ressources indexées par le moteur de recherche. Sont mélangées dans le moteur aussi bien des métadonnées (notice de catalogues, liens vers des ressources sur le Web) que des données (information produite par la bibliothèque, indexation en texte intégral de certaines bases de données disponibles). Il faut non seulement investir en terme d'interfaces, mais aussi de formations pour apprendre au lecteur à manipuler un tel outil. Par ailleurs, les moteurs de recherche fédérée sont bien souvent des boîtes noires, dont on ne connaît pas réellement le contenu.

Mais, les problèmes paraissent encore plus cruciaux en terme d'architecture. La mise en place d'une recherche fédérée ne règle pas le problème et ne fait que le remettre à plus tard. Elle prend appui sur des briques applicatives qui peuvent évoluer, elle fige le système d'information, plaçant l'extraction d'informations qu'au niveau de la recherche en texte intégral et laisse peu de place à des nouveaux usages (navigation dans le fonds, interaction entre les utilisateurs et le fonds) et à l'innovation. A chaque changement dans les briques applicatives, il faut redéfinir le moteur. Surtout, la recherche fédérée ne règle pas le problème qui paraît essentiel avec les SIGB : reprendre le pouvoir sur ces données, pouvoir les manipuler, les faire évoluer, les partager, les migrer, bref, les gérer véritablement.

Manue a aussi dressé ce constat dans un billet dans lequel elle proposait une nouvelle vision du SI en bibliothèques qui repose précisément sur la logique informationnelle et que je développerai dans les prochains billets.

Quelques notes en passant

1 Plusieurs billets du Figoblog font allusion à la recherche fédérée, en vrac : http://www.figoblog.org/document258.php http://www.figoblog.org/document76.php avec un intéressant article sur le sujet : http://www.natlib.govt.nz/files/CUI_Report_Final.pdf ou encore http://www.figoblog.org/document284.php

Management de l'information Système d'information Causeries Moteur de recherche — 

Commentaires

Très intéressant ce billet !!!!!