Les petites cases

L'expression « digital preservation » est-elle pertinente ?

Deux ans que je travaille sur un projet pour mettre en place un « système de préservation » et, finalement, j'en viens à me poser cette question toute simple : l'expression « digital preservation » (traduite par le néologisme « préservation numérique ») est-elle pertinente ?
Rien n'est moins sûr quand je dresse le bilan du travail accompli, je dirais même que cette expression est l'arbre qui cache la forêt. Au final, j'ai l'impression qu'elle a fait croire que le problème se résoudrait par des moyens ou des compétences techniques, alors qu'il n'en est rien, les actions des futurs conservateurs/gestionnaires de collection numérique seront bien les mêmes que leurs collègues qui s'occupent des collections traditionnelles, ce sont les outils et les connaissances qui diffèrent et non les compétences.

Replaçons l'enjeu

« la conservation de l'information sous forme numérique est beaucoup plus complexe que la conservation de l'information sur supports papier ou film. Ceci n’est pas seulement un problème pour les Archives traditionnelles, mais également pour de nombreux organismes qui, jusque-là, n’avaient jamais eu conscience d'assurer une fonction d'archivage. »
Cette phrase tirée du modèle OAIS est fondamentale, car elle pose la problématique : la conservation de l'information sous forme numérique est l'affaire de tous et, non plus simplement, de l'archiviste/documentaliste/professionnels de l'information dont le bureau est au fond du couloir troisième porte à gauche au niveau -3.

Pourquoi cette particularité ?

Dématérialisation et ubiquité

Il existe une différence fondamentale entre l'information sur le support traditionnel et l'information numérique : la dématérialisation.

Comme pour le support traditionnel contenu et support sont indissociables, la conservation du support « suffit » pour conserver le contenu. Mais, dans la mesure où l'information numérique est un train de bits, il est nécessaire de disposer de l'environnement matériel et logiciel adéquat pour pouvoir y accéder, la consulter, l'utiliser. La séparation entre le « support » physique ou virtuel (le logiciel) et le contenu rend a priori plus complexe la conservation de l'information numérique.

Ce problème est d'autant plus prégnant, si l'information est mise à disposition depuis un serveur. Alors même que l'information sur le support traditionnel est disponible en autant d'exemplaires que de supports, l'information numérique n'existe réellement qu'en un seul endroit, le serveur. S'ajoutent alors les problématiques de persistance des identifiants et de continuité du service, revers de la médaille à l'avantage que présente l'information numérique en réseau, à savoir l'ubiquité.

Les cycles d'obsolescence technologique plus courts

Comme pour le support traditionnel, l'information numérique fait face à des risques d'obsolescence. Mais, à la différence des supports traditionnels, les particularités de l'information numérique ont pour conséquence d'accélérer ces risques d'obsolescence. Alors qu'on parle en centaines voire en plusieurs dizaines d'années pour les encres et papiers de mauvaise qualité, les cycles d'obsolescence technologique sont beaucoup plus courts, guère plus d'une dizaine d'années voire moins. Ces risques sont de différentes natures, comme l'explique parfaitement la fameuse présentation « disquette » de Manue :

  • dégradation des supports de stockage ;
  • évolution de l'environnement matériel ;
  • évolution des formats de fichiers et de l'environnement logiciel pour les exploiter ;
  • garantie de l'intégrité et de l'authenticité de l'information numérique.

Face aux risques inhérents aux caractéristiques de l'information numérique, l'enjeu est donc de s'assurer que les utilisateurs pourront continuer d'accéder à l'information numérique sous une forme intelligible au delà des cycles d'obsolescence technologique.

Des compétences traditionnelles pour un support nouveau

Autant le dire de suite. Non, définitivement non, la solution ne consiste pas à imprimer toute la production numérique sur papier, c'est totalement illusoire et impossible eu égard à la perte d'informations que cela engendrerait, sans compter les coûts gigantesques que cela induirait. De plus, c'est totalement contre productif étant donné les moyens financiers engagés dans les projets de « dématérialisation » et de numérisation. Serait-on prêts à payer de nouveau une numérisation à chaque fois que les formats ou les supports sont obsolètes ? Soyons réalistes, cela n'a aucun sens.

Alors, quoi ? Mettre en place une politique de conservation adaptée à l'information numérique. Mais, en quoi cela consiste finalement ?

Revenons aux supports traditionnels. Pour faire simple, le travail des professionnels de l'information consiste à :

  • récupérer et trier la production documentaire d'une organisation ;
  • organiser cet ensemble de manière cohérente ;
  • stocker les unités documentaires dans un espace physique en respectant sa cohérence ;
  • dresser l'inventaire et les caractéristiques des ensembles documentaires ;
  • surveiller les unités documentaires ;
  • mettre en place des actions de « réparation » (Amis professionnels de l'information, je vous laisse ici dresser la liste des actions possibles).

Dans quel but ? Assurer l'intégrité, l'authenticité et la communicabilité des documents.

Eh ! Bien, je vais vous avouer quelque chose, malgré ses particularités, ce sont exactement les mêmes tâches qui doivent être appliquées à l'information numérique. Il n'existe donc pas de spécificités réelles dans les tâches de base pour l'information numérique et, donc, de mon point de vue, pas de raisons objectives pour en faire une discipline en tant que telle.

Vous allez alors me dire, oui, bon, d'accord, mais, là tu joues sur les mots. Où veux-tu en venir exactement ?

En fait, il me semble qu'en introduisant cette notion de préservation numérique, nous nous sommes focalisés sur les moyens, les compétences et les outils techniques, parlant de « système d'archivage » ou de « système de pérennisation » et on a oublié non seulement les compétences traditionnelles, mais aussi une notion, pourtant essentielle : la collection (si vous êtes plutôt bibliothécaire) ou le fonds (si vous êtes plutôt archiviste). En effet, on ne peut gérer une masse d'informations que si ses contours sont maîtrisés et sa cohérence assurée, ce que recoupe parfaitement cette notion.

L'archivage et la pérennisation/conservation ne sont donc que des tâches mises en place par une organisation dans un seul objectif : maîtriser la collection et dans un seul but : assurer la communicabilité de l'information.

Dans le dernier numéro du BBF consacré justement au concept de « collection », Manue et Frédéric Martin dressent des pistes pour comprendre et appréhender la notion de « collection numérique ». Je vous en conseille la lecture, en attendant le prochain billet, dans lequel, vous l'aurez deviné, j'aborderai concrètement les moyens à mettre en œuvre pour envisager sereinement la gestion d'une collection numérique en vue d'en assurer la continuité de l'accès sur le long terme.

Management de l'information Système d'information Causeries — 

Commentaires

mille fois d'accord. ce qui compte dans "archives électroniques", c'est avant tout archives !
c'est le métier qui doit déterminer la méthode et les outils et non l'inverse.
on a parfois l'impression que les grands principes archivistiques deviennent obsolètes parce que l'outil informatique permet de faire ceci ou cela mais que veut-on au final ? une collecte par producteur, des documents bien classés, décrits de façon structurée et normalisée et une gestion de la communicabilité fiable.
OAIS ne nous dit rien d'autre que : collecter, classer, conserver et communiquer. Conserver n'est qu'un bout de la chaîne et un SAE n'est qu'un magasin spécialisé de plus. Et là, les choses paraissent quand même plus claires !

L'expression "digital preservation" est tout à fait pertinente si on ne lui en fait pas trop dire. A mon sens, c'est l'équivelent numérique de la conservation matérielle/préventive. On peut avoir un expert en pérennisation des données numériques, qui connaîtrait à fond les stratégies de préservation et leurs implications (migration vs. émulation, choix des formats, bitstream preservation etc.) mais qui serait incapable d'intervenir plus en amont (acquisition, évaluation). Prenons l'archivage du web: sélectionner les sites à conserver et s'assurer de leur accessibilité à long terme sont deux activités qui correspondent à des champs de compétences différents.
La "digital preservation" n'est qu'une fonction spécifique inscrite dans le cycle de vie des documents, un sous-ensemble de digital curation/recordkeeping.
Le modèle OAIS est d'ailleurs loin de couvrir ce cycle de vie, mais c'est peut-être plus flagrant dans le monde des archives que celui des bibliothèques.

Il serait intéressant de savoir comment les collègues anglophones comprennent vraiment le terme "digital preservation". Car moi (germanophone) j'avais toujours cru comprendre qu'il équivalait à ce qu'on appelle en français "archivage numérique" (ou digital, les avis divergent) - avec la notion d'archivage traditionelle très vaste comme elle est décrite ci-haut. Il me semble qu'en regardant ce qui est discuté à une conférence comme par exemple l'iPRES (International Conference on Digital Preservation) on remarque certes qu'un poids important est donné à la partie pérennisation/conservation, mais que d'autres élements du travail archivistique en font également partie. Je soupçonne même que le terme "digital preservation" ait été choisi plutôt que "digitial archiving" pour éviter les confusions que ce dernier pourrait causer vu son utilisation dans le monde informatique. Quelqu'un en sait-il d'avantage?

@Sous la poussière : Je ne pense pas que nous soyons fondamentalement en désaccord, j'aurais même tendance à te suivre même si les frontières que tu donnes à "digital preservation" me semblent un peu floues et que je ne parlerais pas de "compétences" mais de "connaissances".

Néanmoins, le problème réside dans la perception que les autres personnes (non spécialistes, comme des décideurs ou des managers) se font de cette expression et les conséquences de cette perception. Il ne voit pas "preservation" mais "digital" donc "IT", donc "logiciels", donc "informaticiens", donc.... Je ne te fais pas la suite, je pense que tu l'as connu aussi. Il faut aussi se prémunir des discours simplistes de certains éditeurs dont les solutions résolvent miraculeusement les problèmes. Face à cette attitude, j'ai tendance à adopter une position radicale : ne pas chercher à expliquer l'expression (leur représentation mentale est souvent déjà faite et cela ne sert à rien à moins que tu aies beaucoup de temps ce qui est rarement mon cas) et utiliser d'autres expressions ou d'autres analogies.

Et, puis, comme le dit Vanessa dont je partage entièrement l'avis (mais est-ce vraiment surprenant ?), ça fait du bien de temps en temps de réaffirmer que l'important dans tout cela ce n'est pas la partie "numérique"/"digital"/"électronique"/"informatique" mais la partie archives/préservation/conservation/gestion, parce que si tu l'oublies, à un moment ou un autre, cet aspect te reviendra comme un boomerang et gare à toi si tu l'as vraiment occulté (enfin pour tes données, il sera trop tard...).

Concernant l'OAIS, bien d'accord avec toi, mais c'est normal. L'OAIS est entièrement tourné vers la gestion de l'information une fois acquise/versée.

@Georg : je n'en sais pas plus, mais la question est intéressante. Il faudra la poser à nos collègues anglo-saxons (Y en a-t-il un dans la salle ?)

Je crois bien qu'on est d'accord :)
Message d'espoir après ce que j'ai pu entendre lors d'ECA2010: les informaticiens commencent à comprendre le langage des gestionnaires d'info. Nous n'avons pas bossé en vain!

En matière de terminologie, nous sommes malheureusement encore moins bien servis en français. Sous le terme "archivage électronique", on trouve plusieurs acceptions qui en plus ne s'excluent pas forcément mutuellement. Grossièrement:
- l'archivage au sens purement SI (sortir les données des systèmes en prod pour améliorer les performances)
- la capture automatique des données et transactions (surtout les e-mails), dans le contexte de l'e-discovery
- l'archivage à valeur probante dans les coffres-forts électroniques
- le records management de documents électroniques (et le fait que MoReq traduise electronic records management system par système d'archivage électronique n'aide pas: verser des docs d'un système à la Moreq dans un système à la OAIS, c'est dans le texte faire un transfert d'un SAE vers un SAE)
- l'archivage à long terme

Moi qui travaille sur un projet d'archivage à long terme, combien de fois je reçois des offres de vendeurs de GED!

Ca fait longtemps que je veux faire un billet de blog sur ce sujet, mais j'ai la flemme :)

Même expérience que toi pour les informaticiens (mais il ne faut pas relâcher la pression), il faudrait réussir la même chose avec les couches managériales et les décideurs, parce que là il y a encore du boulot.

Je ne savais pas pour Moreq et c'est juste énorme (bon dieu, ça va pas me réconcilier avec le records management cette histoire)... Comme tu t'en doutes et je l'expliquerai dans un prochain billet, je ne suis pas fan de l'expression SAE (je sais que c'est dans la norme AFNOR 42-013), mais il me paraît bien fallacieux aussi. Quant au terme "archivage", j'ai résolu le problème de manière radicale, j'essaye de le bannir de mon vocabulaire et de mes présentations...

Concernant les GED, régulièrement, j'ai le droit à la question ou à la remarque et j'ai un argumentaire tout ficelé, normalement ça prend pas plus de cinq minutes et la personne repart toute penaud. Faudrait que je fasse un billet, histoire de partager cela aussi.

"les informaticiens commencent à comprendre" : enfin, certains d'entre eux, ceux qui viennent à des manifestations comme ECA ou qui acceptent de dialoguer avec des gens comme nous. J'ai connu moi aussi ce genre de bouffées d'optimisme il y a dix ans lors de la création du groupe PIN qui réunissait spécialistes des SI et représentants d'institutions de conservation. Certes cela a permis de mettre au point OAIS, mais dans combien de DSI ce modèle est-il connu et compris ?
Sur la traduction d'ERMS dans la version française de Moreq : "système d'archivage électronique" n'est sûrement pas idéal, mais c'est la conséquence de la difficulté à traduire RM en français. Un consensus semble se dégager depuis un ou deux ans pour traduire RM par "gestion (ou organisation) de l'archivage", voire par "archivage" tout court. Je pense que c'est ce qui a guidé la traductrice dans son choix. Cela dit, vous auriez traduit comment, vous ?
A part ça, j'attends vos prochains billets sur ces questions avec impatience (moi qui n'ai pas créé de blog...)
PS plus général : quand je dois expliquer à un décideur que pérenniser n'est pas seulement l'affaire de son DSI, ni un problème déjà réglé par la GED, je commence par lui dire que c'est "une question de procédures, pas de procédés". Le slogan est assez parlant pour que je puisse enchaîner ensuite sur des principes et des concepts du genre OAIS et sur la nécessité de penser à l'organisation avant de choisir les outils.

Ne faudrait-il pas tout simplement parler de "préservation du numérique" (en français)? Ou pour ceux qui préfère le mot archive, "archive du numérique".
On passe de l'adjectif au nom, et l'importance qui est attachée au processus est alors déplacée de la numérisation (IT qui se fait presque toute seule) à la préservation qui est un métier!
L'objet de ce processus de préservation concernant bien le nouveau support qu'est le numérique.

Une autre remarque à lecture du post.
Une différence que je vois entre la préservation du physique et du numérique est dans l'usage que l'on souhaite en faire. Pour l'écrit, c'est uniquement en consultation pour ce qui concerne le physique. En revanche, pour le numérique, on peut aussi vouloir construire de nouveaux documents à partir de ce qui a été préservé. Et l'étendue du champ de la préservation dépasse alors ce qui serait strictement nécessaire au simple accès... Quelles en sont alors les conséquences?