Les petites cases

La pérennisation de l'information numérique, mature ! Vraiment ?

Commentaires

En effet, la lecture des commentaires de ce billet est instructive. Je ne pensais pas que le public avait des idées aussi arrêtées et optimistes sur la question ; ceux qui en discutent dans ma salle de lecture sont donc beaucoup mieux informés que je ne l'aurais cru. Pourtant qui ne s'est jamais retrouvé bête devant une disquette illisible ou un fichier obsolète sur son ordinateur ? Je suppose que le fait que les données ne soient pas stockées chez l'usager mais sur un lointain serveur les rend tellement immatérielles et abstraites qu'il en oublie qu'elles ont une existence réelle (et donc destructible) quelque part. Paradoxalement, ça les rend donc plus pérennes dans l'imaginaire collectif.
Il y a un réel travail d'information à effectuer, mais à quel niveau ? Il y a pourtant déjà eu des catastrophes numériques propres à illustrer la fragilité des données.

Concernant tes lecteurs, le simple fait qu'ils soient lecteurs en archives départementales les range dans une catégorie à part : ils sont déjà sensibilisés aux problématiques liées à la conservation et à l'archivage des documents. Je pense que beaucoup de nos concitoyens auraient des réactions sensiblement analogues concernant les archives traditionnelles.

Ah ! le mythe de la dématérialisation ! Merci pour la réflexion sur la distance, elle est très intéressante, c'est une idée à creuser.

En revanche, je n'ai aucune réponse à ta question. Je ne sais pas, j'avoue que je ne suis pas très pédagogue pour le grand public, il m'est donc difficile d'imaginer comment l'expliquer. Je ne crois pas que nous ayons connu des catastrophes numériques si importantes et qui touchent directement les gens. Le jour où la sécu perdra une partie des renseignements de remboursement ou qu'une banque ne sera plus en mesure de fournir les doubles des relevés de compte dématérialisés, là les gens prendront conscience du problème. Nous sommes beaucoup à appeler de nos vœux ce genre de catastrophe qui aurait le mérite de l'électrochoc. En attendant, le problème est peut-être trop abstrait... Je ne sais pas, mais les conservateurs sur le terrain, vous êtes en première ligne pour commencer le travail de dissémination, non ?

Bonjour,

Article très intéressant. Je souhaiterais rebondir sur votre commentaire concernant l'apparition de conceptions différentes de la pérennisation.

Dans le domaine de la préservation digitale, il règne une confusion terminologie et de concepts qui ne favorise pas les réflexions et la progressive entrée de la pérennisation dans les entreprises (qui seront le véritable moteur du marché une fois la problématique adoptée). Archivage ne signifie pas stockage, ni pérennisation. Une distinction peut également être faite entre l'archivage historique, qui a généralement pour objectif de mettre à disposition d'un public large une série d'objets numériques, et l'archivage des entreprises qui a surtout pour objectif de couvrir les risques liés à la perte de l'information. La manière de concevoir les réponses à apporter différera évidemment.

Le premier niveau que vous appelez bit level preservation est pour moi uniquement du stockage. Il consiste à préserver un train de bits uniquement, à savoir le niveau physique et binaire d'une informmation. Le niveau logique (grosso modo le format de fichier) n'est pas nécessairement pris en compte dans ce cadre. Ce n'est donc pas de l'archivage.
L'archivage englobe les questions liées à la sélection de l'information (opération humaine essentiellement même si elle peut être semi-automatisée via des règles de sélection), à leur mise en sécurité ainsi qu'à leur description en vue d'être retrouvée.

L'archivage englobe donc les questions reprises ci-dessous et est davantage tournée vers des règles de gestion, e.a. du cycle de vie, et la mise à disposition de l'information des utilisateurs.
Selon moi, l'accès à l'information (au niveau descriptif) ne relève pas de la préservation numérique. Cette "discipline" doit uniquement veiller à ce que l'objet reste lisible et compréhensiblee (niveau logique et éventuellement sémantique de l'information). L'accès proprement dit (càd le fait de rechercher, trouver et délivrer l'information à l'utilisateur) relève de l'archivage (et les logiciels et les pratiques en la matière gèrent cela de manière satisfaisante).
cf. entre autres diverses présentation de Mme Chabin sur l'agencement entre le modèle OAIS et le records management (dont celle-ci)

Cette distinction permet de concevoir une architecture sur trois niveaux :

  • archivage --> gestion des accès, workflow, métadonnées descriptives, etc.
  • entrepôt de pérennisation --> gestion du niveau logique, métadonnées de préservation (technique, intégrité, etc.)
  • stockage physique des données --> contrôle et rafraichissement des supports, backup, métadonnées pour la gestion des supports

Cependant, comme vous le mentionnez, ceci vaut surtout pour les dépôts institutionnels, etc. Pour la plupart des entreprises, il faudra veiller à ce que l'information présente dans les systèmes d'informations soit pérenne mais de manière simple (ce qui implique par exemple que les normes telles que PREMIS ne devront pas être utilisées). Pour ce faire, il faudra sans doute passer par des recommandations simples (type conversion des fichiers dans des formats qualifiés de pérenne), etc.

Enfin, pour répondre à got, cela m'étonnerait que la secu n'ait pas déjà perdu des données faute de pouvoir les relire mais cela m'étonnerait qu'elle en fasse la publicité.

Par ailleurs, les dépôts institutionnels font de plus en plus leur apparition dans des contextes moins patrimoniaux (archives notariales, en Belgique archivage de contrats de travail électroniques en vue de la pension --> durée de conservation +/- 80-100 ans, etc.) --> l'archivage et la préservation à long terme vont devenir une réalité de plus en plus concrète dans le quotidien de M. et Mme Tout le monde.

Au plaisir de continuer la discussion pour tenter d'améliorer nos réflexions réciproques.

Poster un nouveau commentaire

Le contenu de ce champ ne sera pas montré publiquement.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • You may post code using <code>...</code> (generic) or <?php ... ?> (highlighted PHP) tags.

Plus d'informations sur les options de formatage

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
7 + 2 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.