Les petites cases

Mais qui sont les chasseurs et les dindons de la farce ?

Ce qu'on nomme aujourd'hui “l'affaire” Google print aura eu au moins un avantage : mettre enfin le débat sur la numérisation du patrimoine sur le devant de la scène. Ainsi, dans Libération du 30 août 2005, Wladimir Mercourrof, vice-président de Armines (association de recherche créée par l'Ecole des mines), et Dominique Pignon, directeur de recherches au CNRS nous gratifient d'un article que je qualifierai de “gentil et mignon”. Il semble évident que cet article n'est pas destiné aux spécialistes de l'information, mais bien au grand public. Cela n'excuse pas les approximations, les erreurs et surtout le mépris du travail réalisé ces quinze dernières années. Je ne reviendrai pas sur les parties consacrées à Google, cela ne sert à rien et j'y reviendrai bientôt d'une manière que j'espère constructive1...

A la lecture de l'article, on a réellement l'impression que les bibliothèques françaises, et élargissons à tous les institutions de conservation, n'ont rien fait dans le domaine de la numérisation, qu'ils sont restés les bras croisés. Auraient-ils oublié les différentes réalisations ? Pêle-mêle, quelques exemples :

  • En tout premier lieu, Gallica. Je ne vais pas m'étendre sur le sujet, tout le monde connaît la bibliothèque numérique de la BnF. Malgré ses défauts, cette initiative a le mérite d'exister et d'offrir à l'heure où j'écris ces modestes lignes 70 000 ouvrages numérisés, constituant ainsi la plus vaste bibliothèque numérique d'ouvrages sur le Web ;

  • Persée, projet de la Sous-direction des bibliothèques du ministère de l'Education Nationale, propose la numérisation rétrospective de sept revues scientifiques françaises reconnues mondialement ;

  • Le projet enluminures et Liber floridus, proposant la numérisation des enluminures de tous les manuscrits conservés dans les bibliothèques municipales et universitaires.

  • Sans oublier les deux pionniers que sont la bibliothèque électronique de Lisieux et la bibliothèque interuniversitaire de médecine.

Ce ne sont que quelques exemples caractéristiques des projets de numérisation dans différentes domaines, avec différents moyens et surtout provenant aussi bien du monde universitaire que de la Culture. Pour une liste exhaustive, je vous renvoie au catalogue des fonds numérisés sur le site du ministère de la Culture. A la vue de cette liste, il faut quand même reconnaître que la numérisation est devenue depuis longtemps une « mission prioritaire des bibliothèques ». Si le bilan n'est pas aussi brillant que l'auraient désiré ces deux messieurs, il faut plutôt aller chercher les responsabilités du côté de nos grands argentiers à qui il aura fallu nommer l'ennemi, « lever le lièvre » pour prendre enfin toute la mesure de l'enjeu et nous donner les moyens d'avancer.

En effet, l'article affirme : « La nouveauté de l'Internet est de permettre une diffusion à un coût très faible, et de manipuler et d'organiser de très grandes quantités de données. », cela est vrai, néanmoins la numérisation coûte cher. Évidemment, les coûts ne sont pas au niveau de la diffusion, mais du côté de la production. L'acte de numérisation en lui-même n'est pas non plus ce qui coûte le plus, mais lorsque vous recevez des images en vrac ou un texte ocrisé et balisé dans le meilleur des cas, le travail n'est pas terminé, il reste encore à mettre en place les métadonnées, relire les textes, vérifier la qualité de la numérisation, le balisage le cas échéant et surtout les interfaces de navigation et d'accès à l'information2. Bref, après avoir mené un projet de numérisation au printemps, j'ai changé toutes mes idées de la numérisation, non seulement cela a un coût mais présente des difficultés importantes.

Je ne vais pas m'étendre, vous aurez compris que nous avons affaire là à un article qui ne fait rien avancer, sans réflexion et qui se trompe de cibles. Je ne reviendrai donc pas sur les erreurs commises sur l'histoire du livre (je leur conseille la lecture des ouvrages de Henri-Jean Martin et de Roger Chartier), ni sur les approximations sur les problèmes de la lecture à l'écran et l'édition électronique, où il mélange allègrement la numérisation et les problèmes d'édition électronique (lecture indispensable : Numériser, ce n'est pas éditer...).

Bon, je m'arrête là, il paraît que c'est déjà trop long et, à peine arrivé dans la blogosphère, je vais me faire des amis....

Numérisation Râleries —