Martin Sévigny - Frédéric Glorieux - AJLSM

Conservation

Résumé

Les documents XML sont de bons candidats pour la conservation à long terme, et ce pour les raisons suivantes:

  • Le format est normalisé

  • Les documents sont indépendants des plates-formes ou systèmes ou logiciels

  • Les informations sont autodécrites

  • Les documents peuvent être lisibles à l'oeil

Ce dernier point est assez important. En effet, pour consulter et comprendre un document XML, il suffit d'avoir en sa possession un ordinateur et un simple éditeur de texte. Ce ne sont pas des documents binaires ou à codage complexe, ce sont des documents qui utilisent des balises compréhensibles par les humains, pour autant que l'on connaisse la langue des balises et le sens des mots utilisés.

Le format XML est donc la pierre angulaire de l'archivage des données électroniques, et le gouvernement français l'a récemment identifié formellement comme tel.

Il est désormais acquis que les systèmes d'informations ont une durée finie. Les technologies changent, l'information doit rester. Or les formats propriétaires ont montré de nombreuses limites. Quand bien même ils soient adossés à un géant, la compatibilité d'une version à une autre n'est pas toujours assurée, et du temps de travail peut être perdu, quand il est trop spécifique à une application, ou à une technologie (exemples: les mises en forme uniquement visibles dans un seul logiciel, aussi diffusé soit-il, les savantes constructions relationnelles pour contourner l'interdiction de répéter des champs). On ne connaît pas encore le destin de XML, mais son ancêtre SGML nous assure de cette expérience : toute l'information voulue au départ peut être retrouvée plusieurs décennies après.