Archives de l'État en Belgique

Notre mémoire à tous !

Menu

Conservation des archives numériques

Texte petit  Texte normal  Texte grand

Comment choisir un format de conservation ?

Il n’existe pas de format idéal pour la conservation des documents numériques. Néanmoins, vous pouvez mettre en place une stratégie qui consiste à s’adapter à l’évolution inévitable des technologies en identifiant les formats qui vont faciliter la conservation des informations et en éliminant les formats qui poseront à terme des difficultés. Vous pouvez retenir deux critères principaux :

  • l’ouverture et/ou large diffusion : privilégier les formats publiés et ouverts. Cependant, des formats propriétaires, dont les codes sources ne sont pas publiés, mais qui sont largement diffusés (ex : PDF ou TIFF) sont parfois préférables aux formats ouverts. En effet, plus un format est diffusé, plus il existe des outils qui sont développés pour l’exploiter et en maintenir la compatibilité avec les formats plus récents.
  • l’indépendance : le format choisi ne doit pas être dépendant par rapport à d’autres formats ou par rapport à un système d’exploitation.

Pour de plus amples informations, vous pouvez consulter le tableau des formats de représentation.

Comment choisir un support de conservation ?

Chaque support de conservation présente des avantages et des inconvénients. Il convient d’analyser les besoins spécifiques pour chaque utilisation. Pour ce faire, il est utile de vous interroger sur les points suivants :

  • la capacité de stockage,
  • la stabilité,
  • l’existence d’outils de contrôle,
  • le caractère plus ou moins répandu de la technologie ou reposant sur des normes publiques,
  • la disponibilité d'équipements permettant un stockage et une manipulation automatique,
  • le coût direct,
  • le coût des équipements de lecture et d’écriture,
  • la vitesse de lecture et de l’écriture
  • le mode d’accès à l’information,
  • le caractère réinscriptible ou non des supports (intégrité des données).

Pour de plus amples informations, vous pouvez consulter le tableau des supports de stockage.

Comment conserver des documents bureautiques ?

Les documents bureautiques sont des documents électroniques créés à l’aide de logiciels bureautiques. Il s’agit de fichiers de textes, de fichiers de calculs/graphiques, de fichiers de présentations ou de fichiers de bases de données (de petites tailles – pour les bases de données de grande importance, consultez la rubrique Comment dois-je conserver mes bases de données ?). Avant toute chose, il convient de nommer et de classer correctement les documents créés ou reçus en suivant les règles de nommage et de classement. Ensuite, on sélectionnera le format le plus adapté en fonction du type de document et de la durée de conservation. Exemple : le format Word (DOC) d’un fichier texte pour une conservation temporaire (moins de 10 ans), le format PDF ou PDF/A dans le cas d’une conservation permanente. Vous trouverez une liste complète des formats de conservation dans la brochure Directives pour la gestion et l’archivage numérique des documents bureautiques (pour le meilleur support de stockage, consultez la rubrique ci-dessous, relative aux supports de conservation).

Comment choisir les métadonnées ?

Définition

Littéralement « données sur les données ».
Les métadonnées sont des données qui décrivent le contexte, le contenu, les actions administratives et la structure physique et logique d’un ensemble de données. Les métadonnées servent à organiser l’information, à exploiter les documents, et à assurer l’accessibilité et la traçabilité des données dans le temps.

Quand ajouter les métadonnées présentées dans le tableau ci-dessous ?

Dès la création d’un document et tout au long de son cycle de vie, il est nécessaire d’ajouter des métadonnées afin de pouvoir tracer les actions effectuée sur un document: à sa création/modification, à sa numérisation, à sa migration, à son transfert, à son archivage, à son élimination, etc.

Faut-il conserver les métadonnées avec les documents qu’ils décrivent ?

Les documents d’archives et leurs métadonnées associées peuvent être conservés dans des espaces de stockage différents par des raisons de sécurité, mais ils devront être associés moyennant un identificateur unique,une autre référence ou un lien. La lisibilité et la compréhension des documents archivés et de leur contexte dépendent de cette association.

Comment conserver des e-mails ?

Attention au respect de la législation sur la vie privée (cf. En savoir plus sur les e-mails).

  1. Le contenu et les éléments de description à prendre en compte pour la conservation d’un e-mail sont :
    • les éléments de l’en-tête : adresse de l’expéditeur, adresse du destinataire, objet, date et heure d’envoi (…)
    • le message en tant que tel
    • La(les) pièce(s) jointe(s)
  2. Le format de conservation : pour garantir une lisibilité sur le long terme, il est impératif de choisir des formats pérennes, ouverts et standards (cf. question Comment choisir un format de conservation ?)


Pour plus de détails, veuillez suivre les recommandations de la question Comment garantir la conservation à long terme de mes documents électroniques ?

Comment conserver un site internet ?

Suivant la nature du site (degré de complexité, importance stratégique), il est souhaitable d’appliquer une, voire plusieurs, des méthodes suivantes :

  1. la conservation du code source : pour les sites internet statiques, cette méthode est relativement simple. Elle n'est par contre pas adaptée aux sites internet dynamiques. Pour ces derniers, en plus de conserver le code source, il s’agira également d’appliquer les méthodes mentionnées ci-dessous ;
     
  2. la conservation d’une photographie instantanée, d’une capture d’écran (snapshot) du site internet : cette méthode requiert l’utilisation de logiciels appelés aspirateurs de sites internet qui permettent de transformer des sites dynamiques en sites statiques.
    Parmi les logiciels les plus courants utilisés pour effectuer ce type de conservation, nous pouvons mentionner :
    • HTTrack : logiciel libre qui permet de télécharger le site du serveur d’internet vers votre disque dur avec ses répertoires, images, fichiers, code-source en HTML et les liens entre tous ces éléments ; une fois téléchargé, vous pourrez naviguer librement à l'intérieur du site internet, comme si vous étiez connectés.
    • Heritrix : logiciel libre aussi, c’est un robot d’indexation (web crawler) qui permet de stocker des ressources des sites internet dans un fichier en format ARC ou en format WARC.
       
  3. la conservation par le biais d’un enregistrement d’une session de navigation : cette méthode consiste à créer une vue animée au format vidéo  d’une session internet, c’est-à-dire d’une de vos visites du site internet.

Nous vous conseillons de contacter les Archives de l’État pour choisir la meilleure méthode de capture et le meilleur format des éléments du site.

Pour de plus amples informations, consultez ci-dessus la rubrique relative aux formats de conservation d’archives.

Comment conserver un base de données ?

En attendant le transfert vers les Archives de l’État, les données inactives figurant dans une base de données seront conservées dans une base de données d’archivage. Cette action améliorera le fonctionnement et la performance de la base de données de production en libérant de l’espace. Les groupes de données identifiées comme inactives seront retirés, voire exportés, périodiquement ou ponctuellement de façon sécurisée, en prenant soin d’en préserver la signification et d’en capturer tous les éléments qui rendent les données utilisables. Enfin, l’extraction des données ne doit pas mettre en péril la consistance de la base de données de production.

Pour de plus amples informations, consultez ci-dessus la rubrique relative aux formats de conservation d’archives.

Comment garantir la conservation à long terme de mes documents électroniques ?

La stratégie à appliquer repose sur la prise en compte des trois éléments suivants :

  • le format des fichiers (TEXTE : .rtf, .txt ; IMAGE : .jpg, .tiff ; MIXTE : .pdf, .pdfa, …). Pour de plus amples informations, consultez ci-dessus la rubrique relative aux formats de conservation des archives ;
  • les métadonnées (ex. pour un document texte : nom de l'auteur, date de création, date de modification, résumé, longueur, mots clés, bibliographie, sources, liens) ;
  • le support de conservation (disque dur, CD, bandes, etc.).

Contrôlez régulièrement que les documents restent lisibles en vérifiant les formats et supports. Envisagez au moment opportun une conversion de format ou une migration du support. Pour de plus amples informations, contactez votre service informatique.

Comment restaurer des documents électroniques endommagés ?

Plusieurs types de dommages peuvent survenir : un dommage sur le format (dommage logique) et un dommage sur le support (dommage physique).

Si le format est endommagé, il est nécessaire d’utiliser des logiciels de restauration du format. Mais ceux-ci n’offrent aucune garantie de restauration complète ou rigoureuse.

Si le support est endommagé, le dommage est dans la plupart des cas irréversible. Certaines techniques (très coûteuses) permettent néanmoins une récupération partielle de l’information (ex. en cas de crash d’un disque dur, des sociétés spécialisées se chargent d’ouvrir le disque dur et de vous faire parvenir une copie des fichiers récupérables).

Deux précautions valent mieux qu’une : il est préférable de mettre en place une stratégie de conservation efficace pour les formats et les supports plutôt que de réagir une fois le dommage survenu. Adressez-vous à votre service informatique pour optimaliser cette stratégie et demandez, au besoin, l’avis des Archives de l’État.

Un système de gestion électronique des documents doit-il inclure un plan de classement pour les documents si ses fonctionnalités permettent de les rechercher en plein texte ou sur requêtes ?

Oui, un plan de classement reste indispensable pour des fichiers électroniques gérés par un système de gestion électronique des documents (GED) car le plan de classement offre l'avantage unique et primordial de donner une vue d'ensemble des fichiers/documents existants, en référence au contexte de leur  production et de leur utilisation. Posséder une vue d'ensemble de vos documents est la condition fondamentale de la maîtrise de votre information. Le plan de classement est un élément essentiel à la reconstitution du contexte institutionnel et fonctionnel dans lequel les documents ont été produits et reçus car il indique par quel niveau administratif et dans le cadre de quelle compétence/fonction les documents l'ont été.

Il permet en outre une recherche sur la base de la hiérarchie du classement (exemple : l’organigramme des services ou les fonctions exercées par les agents). En revanche, la recherche des documents uniquement en plein texte ou sur base de leurs métadonnées vous réduit à une vision éclatée, parcellisée. L’existence du plan de classement n'empêche nullement de développer d'autres méthodes de recherche par requêtes basées sur des métadonnées. Un bon système de GED comporte d’ailleurs toujours les 2 approches de recherche : structurée (selon le plan de classement) et par requêtes (selon les métadonnées).

Le plan de classement est l’ossature de l’inventaire des documents que l'arrêté royal du 18 août 2010 (art. 9) sur l'exécution des articles 5 et 6 de la loi des archives oblige chaque administration à tenir. Il sera également l’ossature de l’inventaire des archives à transférer aux Archives de l’Etat, imposé par l'arrêté royal du 18 août 2010 (art. 17) sur l’exécution des articles 1er, 5 et 6bis de la loi des archives.

Enfin, le plan de classement est lié au tableau de tri. Dans un bon système de GED, le tri des documents est le plus possible automatisé, en lien avec le tableau de tri approuvé par les Archives de l’Etat. Quand le plan de classement et le plan du tableau de tri sont identiques, la gestion des séries de dossiers sera grandement facilitée par une élimination au niveau de la série plutôt qu’une élimination au niveau du dossier ou du document.

www.belspo.be www.belgium.be e-Procurement